颜小二的 SLA 是多少?可用性、响应时延与故障补偿
简短答案:颜小二自媒体发布 API 平台标准 SLA 为月度可用性 99.9%、统一文章接收 API 的响应时延 P95 ≤ 500ms、callback 推送 P95 ≤ 5 分钟。下游平台侧不可控因素(如平台审核延迟、平台前端故障)不计入 SLA 统计。
下面讲清楚 SLA 怎么衡量、什么算违约、违约怎么补偿。
背景与机制
很多客户问 SLA 时其实想知道两件事:发布会不会因为颜小二自己挂掉而失败?万一挂了我能怎么办?
颜小二的 SLA 拆成三个独立维度:
1. API 可用性:统一文章接收 API 在月度统计窗口里的成功响应比例 2. API 响应时延:API 返回的时间分布,P95 是核心衡量 3. 回调及时性:从任务进入终态到 callback_url 收到回调的时间
这三个指标都只衡量颜小二自己控制的部分——你侧网络、平台侧审核、各家平台前端故障,这些不在 SLA 计算范围内。
相关字段(标准 SLA 一览)
| 维度 | 标准 SLA | 衡量口径 | |---|---|---| | 月度 API 可用性 | 99.9% | 自然月内成功响应数 / 总请求数 | | API 响应 P95 | ≤ 500ms | 从颜小二接收到返回的服务端耗时 | | API 响应 P99 | ≤ 1.5s | 同上 | | callback 推送 P95 | ≤ 5 分钟 | 任务终态到首次 callback 抵达 | | 故障响应时间 | ≤ 30 分钟 | 工单确认 + 工程介入 | | 故障恢复时间(P0) | ≤ 4 小时 | 全平台不可用类故障 |
不计入 SLA 不可用时间的情况:
- 客户侧问题:API Token 错误、签名错误、callback_url 不可达、本地 Agent 离线
- 平台侧问题:头条号 / 微信公众号等平台的审核延迟、平台前端不可用、平台风控触发
- 不可抗力:地震、断电、DDoS 等基础设施级事件
- 预先通知的维护窗口:提前 ≥ 48 小时通知,且单次 ≤ 30 分钟
注意事项
第一,SLA 是 SaaS 侧的承诺,不替代你侧的容错设计。比如你需要在调用失败时 retry、在回调超时未收到时主动查询。
第二,登录态本地保存意味着账号侧故障由你负责。login_expired 不算颜小二的不可用,但颜小二会在告警字段上做到位。
第三,私有部署的 SLA 与 SaaS 不同,按合同单独约定,通常会更宽松(取决于客户侧基础设施)。
第四,违约补偿一般以"次月服务时长延长"或"次月费用减免"形式给到,具体补偿比例按可用性偏离程度阶梯计算,详见合同附件。
相关问题
- SLA 透明吗? 历史可用性数据可向商务索取月度报告。重大故障会发布事后复盘。
- 可不可以谈更高的 SLA? 大客户与私有部署支持单独谈 99.95% 甚至更高,对应费用调整。
- 故障期间发出去的任务怎么办? 已进入终态的任务正常回调;进行中的任务故障恢复后会按重试策略重新执行(同
external_id不会重复发)。
常见问题(FAQ)
Q:怎么发起 SLA 申诉? 按合同约定的渠道(邮件 / 工单系统)提交,附月度日志,颜小二侧 ≤ 5 个工作日给出书面答复。
Q:可用性是按租户算还是全平台算? 按全平台算,多租户隔离设计下你的租户和别的租户共享同一套基础设施可用性。
Q:单平台短时不可用算颜小二违约吗? 取决于不可用根因。如果是颜小二侧适配层故障算,平台侧故障不算。回调里 error_msg 会带平台侧错误码便于定责。
Q:SLA 违约补偿能不能折现? 通常不折现,以服务延期或下月费用减免方式给到。特殊情况按合同单独沟通。
Q:维护窗口一般什么时间? 绝大多数维护安排在凌晨低峰期,提前 48 小时通过控制台与邮件通知,单次时长尽量控制在 30 分钟内。
下一步
如果你侧的 IT/运维需要 SLA 详细条款用于评审,签约前可以索取标准合同附件,里面有完整的 SLA 表与补偿矩阵。
→ [免费申请接入](/contact.html#form) | [API 文档](/docs.html) | [更多常见问题](/faq.html)