以太坊智能合约漏洞检测：机器学习系统化综述

关键词：智能合约漏洞、以太坊安全、机器学习、深度学习、图神经网络、漏洞检测、未知的漏洞、类别不平衡、系统化综述

1. 背景：为什么以太坊成为攻击热点？

以太坊智能合约一旦部署便不可篡改，这既是信任优势，也成了修复难点。
对黑客而言：

传统漏洞检测工具（静态分析、符号执行、动态分析、形式化验证、模糊测试）受限于人工规则的覆盖范围，对“未知的漏洞”无能为力。因此，近年学界将目光投向机器学习驱动的检测方案。

本文执行 PRISMA 规范，从 IEEE、ScienceDirect、Springer、ACM 等六大数据库中检索 2019–2024.5 期间的中英文文献，排除综述、书章节、非以太坊场景后，最终纳入 55 篇高质量研究。

三大研究问题：

典型模型：Random Forest、SVM、K-NN。
优点：解释性强、计算量小。
缺点：需人工抽取特征，难以捕获深层语义。

实务中，图神经网络因能够保留程序语义与结构信息，成为漏洞检测 SOTA（State-of-the-Art）。

Bagging、Boosting、Stacking 组合多基学习器，提升稳定性。ContractWard、CDRF 通过投票或加权降低单模型误报。

数据层面：SMOTE、SMOTE-Tomek 人工扩展 minority 类，适用于数据稀缺场景。
算法层面：Focal Loss、加权交叉熵直接优化损失函数，避免过采样导致噪声放大。
👉 我们的发现：算法级方法在大规模图上可显著减少训练时间与内存膨胀，成为未来方向。

业界尚无统一定义。本文采纳：
“已存在但未被现有工具标记的缺陷”。
三种代表性策略：

Q1：数据从哪里来？
A：SmartBugs、Etherscan、SolidiFI 三大开源标杆集最常出现；总计 12 个数据集在 55 篇论文中交叉复用。

Q2：Deep Learning 是否必用 GPU？
A：中等规模图（<10 K 样本）CPU+8 GB RAM 即可；百万级合约需 GPU 图神经网络训练 ≥12 h。

Q3：F1-score 与 Recall 谁更重要？
A：链上资金场景宁可误报，不可漏报，故Recall 应作为首要指标，其次才是 F1。

Q4：能在私有链跑检测吗？
A：可以。离线静态分析无需节点配合；动态检测需 fork 私链并部署兼容测试网。

Q5：模型上线后怎么持续更新？
A：CI/CD 每周增量学习 + Curriculum Learning，把新漏洞样本循序加入，保证分布平稳迁移。

本综述为合约审计团队、安全产品研发者、学术研究实验室提供一站式入口。下一步，我们将在真实金融合约百万级图上验证 Curriculum + GNN 框架，敬请期待。