目标读者:对 量化加密投资 已有初步认知,希望理解 多因子模型 背后经济含义与数学框架的研究者、交易团队与高级个人投资者。
什么是“因子”?
“因子”在加密市场里有三个常见别名:技术指标、机器学习特征 或 alpha 因子。本质都一样:量化某种能够解释 加密货币未来涨跌 的共同驱动力量。
团队长期跟踪六大类 alpha 因子,并把它们汇聚成决策因子库:
- 基本面因子:TVL、收入增速、开发活动、治理提案数
- 链上因子:活跃地址增长率、大额转账占比、矿工抛压
- 量价因子:动量、波动率、订单簿深度、资金费率
- 衍生品因子:期权偏度、期货基差、永续合约资金费率
- 另类因子:社交媒体情绪、开发者 GitHub 热度、安全审计等级
- 宏观因子:美元指数、美债实际利率、比特币算力
只有通过系统化的 因子计算、检验、去噪、加权,才能给出每个资产 预期收益率 的准确估计。
CAPM:单因子模型的起点
1964 年,Sharpe 提出 资本资产定价模型(CAPM),第一次用简洁线性定价:
E(R_i) – R_f = β_i × (E(R_m) – R_f)其中 β_i = Cov(R_i, R_m) / Var(R_m) 代表资产对市场风险的系统性暴露。
- β > 1 资产剧烈放大市场波动
- β = 1 涨跌与大盘同步
- 0 < β < 1 上涨温和、下跌迟钝
- β ≤ 0 逆势而行
CAPM 只用一个 “市场因子” 即可解释收益,奠定了后续多因子大厦的地基。
加密市场能否直接套用 CAPM?
2022–2024 年 BTC/USDT 30m 高频数据显示,若仅用 BTC 自身做市场组合,美债收益率、美元指数同样对回报 β 显著;说明 单一市场因子是偏置的 👉 想知道如何把宏观变量“塞进”10 行 Python?点我掌握最新技巧。
APT:把单因子拓展为多因子
在 CAPM 的基础上,套利定价理论(APT) 认为资产收益是多个因子的线性叠加:
E(R_i^e) = Σ β_i,k × λ_k- λ_k:因子 k 的 溢价
- β_i,k:资产 i 对该因子的暴露
APT 的结论:只要构造一个 N≥K+1 的多因子组合,就能剥离多余的非系统性风险,锁定 alpha。
Alpha、Beta 与多因子组合收益分解
更贴近实战的 多因子回归方程:
R_i,t^e = α_i + Σ β_i,k × f_k,t + ε_i,t- α_i:经风险因子定价后的 pure alpha(定价错误,可多空套利)
- β、f:beta 收益来源,无法对冲的系统性补偿
- ε:特质收益,统计平均为 0
策略团队正是把不同资产的 α 打分汇聚成 alpha 组合,再用 最优对冲矩阵 平掉 beta(见本系列第 4 篇 “风险组合优化”)。
多因子风险的分解与波动率
实操中最关心的核心是 组合波动率 σ_p²。基于矩阵表述:
R_p = W' (β_f + α)推导得:
σ_p² = W'βΣ_fβ'W + W'ΔW- Σ_f:K×K 各因子协方差矩阵
- Δ:特异风险对角矩阵
求 均值-方差效用最大组合,即可把 ∑α_i、σ_p² 转化为 最终持仓权重。
常见疑问 FAQ
Q1:小市值币种的链上数据稀疏,如何防止因子计算失准?
A:用 收缩估计(shrinkage estimation)+贝叶斯更新,把小币 β 向同类高流通币聚合,回避极端值。
Q2:市场上因子做的人很多,α 是不是早被卷没了?
A:新 alpha 总在 数据维度升级 中诞生。例如引入高频订单簿微观结构,或把链上 + 资金费率联合做 alpha 训练,仍具独立信息。
Q3:比特币、以太坊常出现“庄家砸盘”,这种尾部黑洞可以量化吗?
A:在 β 波段模型中插入 极值因子(VaR、DBSCAN 异常点) 即可在信号层动态降权异常样本,整体夏普反而提升。
Q4:多因子会不会过度拟合?
A:采用 滚动 IC、跨周期验证、样本外组合回撤 三套机制把关,确保因子仍有 未来成立概率。
下一步预告
理论基础篇只是开场,接下来会用三篇文章逐步落地:
- 单因子构建:数据清洗、极端值 Winsor、中性化、有效性检验
- 大类因子合成:共线性检查、IC_IR 加权、局部非线性提升
- 风险组合优化:交易成本、杠杆控制、尾部情景压力测试
持续关注,洞悉 加密量化前沿。