OKX关于12·18交易中断的恢复进展与后续优化方案

·

事件回顾:一次云服务故障引发的大规模停机

2022年12月18日11:00(UTC+8),OKX部分用户在行情刷新、下单、撤单时陆续遭遇报错;经技术定位,问题来自云服务商机房链路故障。随后,现货、合约、杠杆等交易服务全面暂停,直至第二天02:50才完全恢复,累计中断时长约15小时50分钟。

许多投资者在社群发问:

官网在18日凌晨3点后陆续公告无误,并第一时间启动故障补偿通道多云部署预案,下文将拆解整个过程与防范机制。

恢复过程一览:48小时内四阶段

  1. 故障发现期(12月18日11:00-11:10)
    网络监控显示数据包大量丢失,运维进入应急响应,触发Ⅰ级故障流程。
  2. 数据一致性校检(11:10-12月19日00:00)
    交易引擎切换至离线模式,推送Post Only与撤单专享通道,校验1700余笔挂单状态。
  3. 启动停机恢复保护(19日00:30-02:50)
    允许撤单、补保证金,撮合引擎仍未开启,防止极端行情引发穿仓。
  4. 全面开放撮合(19日02:50后)
    全币种正常交易,API延迟恢复至20 ms以内。

整个过程中,系统资金安全链上存提均未受影响。

后续优化计划:从“单云”迈向“多云”

在复盘会上,OKX把“多云多活”升级为2023财年Top1工程。重点包括:

高并发常态化后,多云韧性已成刚需;👉 想每周第一时间确认演练结果,点这里设置提醒

用户损失与补偿机制

12月19日06:00,官方联合风控团队发布补偿规则

  1. 因平台故障导致的意外爆仓按最近一次窗口均价回补权益;
  2. 强平穿仓用户可额外申领“稳态资金券”,可做现货交易抵扣;
  3. 行情中断期间价差套利受损,平台将通过“观察区间温补”方式赔付;
  4. 所有受影响账号索赔入口打开7天,无需上传资料,由系统自动匹配日志。

若曾在18日当天持有杠杆、永续合约、杠杆ETF,邮件可能已到达钱包绑定邮箱,注意查收。

FAQ:关于这次事件你可能仍有疑问

Q1:云故障是否会导致资产被黑客攻击?
A:不会。订单撮合、资产账本、热钱包私钥分属不同安全域;本次故障仅限撮合引擎-云API链路中断,核心加密模块始终在线。

Q2:多云部署完成后,未来还会再停机吗?
A:任何系统都无法保证“零故障”,但多云+本地热备可将停机时长压缩到分钟级;关键链路还有自愈脚本,力争把滑点控制在0.1%以内。

Q3:我已经平仓,但系统显示“恢复空白成交单”,这正常吗?
A:属于压测阶段产生的测试数据,交易凭证已在链上作废,不会计入盈亏,请安心。

Q4:什么时候上新版APP体验多云模式?
A:预计Q1内推Beta,灰度范围1万名实名用户,老客户可提前申请内测资格。

Q5:对高频量化团队是否也有专项方案?
A:会上线专属低延迟通道Failover ALGO,支持毫秒级授权切换,让利给急需行情推送的机构端。

总结:把危机变契机

一次长达15小时的交易中断,让平台直面“单点依赖”带来的巨大风险。OKX通过高透明度公告、快速偿付、跨云演练,将用户体验跌幅降到最低。👉 若想深入了解多云技术细节或实时演练周榜,建议收藏关注

未来,交易稳定性资产安全将继续成为平台生命线。我们将定期公开进展,欢迎每一位用户共同监督,共建更健康的加密交易生态。