Politics
AI 计算资源危机
AI 算力供应紧张对行业 adoption 的影响分析
核心论点:AI 算力危机已经到来
作者 Martin Alderson 认为,AI 计算资源危机不是"即将到来",而是已经到来。供应链难以跟上需求增长,这是一个被严重低估的风险,将对未来一到两年的 AI 普及产生重大影响。
见:Is the AI Compute Crunch Here?
供应端 struggling 的证据
Anthropic 的服务降级:
- 2025 年 3 月,Claude 系列服务 uptime 降至 "one 9"(约 90%)
- 官方承认这是"前所未有的增长"导致,难以预测
- 被迫采取降质措施:降低默认 effort 级别、移除旧模型访问、禁用 prompt 建议
行业普遍问题:
- OpenRouter 上整个行业的可靠性都很差
- 阿里云 CEO 表示:"我们部署新服务器的速度跟不上客户需求的增长"
- 4 个月后,情况依然严峻
Agentic AI 的拐点效应
2025 年秋季以来,模型能力(尤其是 Opus 4.6 和 GPT 5.4)在软件工程任务上取得突破,导致:
- 更多复杂流程适合 agentic 模型(从构建 C 编译器到解决数学算法问题)
- Agentic 流程消耗 token 的速度远超其他 LLM 用途
渗透率数据:
- Claude Code 年收入 25 亿美元,估算约 200-300 万付费用户
- 相比 OECD 2-3 亿专业/管理工作者,渗透率仅 1-2%
- 企业采用仍处于试点阶段,全面部署将带来巨大需求增长
硬件层面的硬约束
DRAM 供应瓶颈:
- 作者估算,DRAM 供应对 AI 基础设施设置了一个约 15GW 的硬上限,直到 2027 年
- DDR5 内存价格从 2025 年 5 月的 $110 涨至 12 月的 $415
- HBM(高带宽内存)与 DDR5 争夺同一上游晶圆产能
数据中心建设的真实阻碍:
- 许多报道中的"融资问题"或"投资者犹豫",实际是电力、计算资源、内存和建筑劳动力短缺
- 无论 Oracle、Softbank 或 Codeweaves 投入多少资金,在供应改善前都无法建成新的 AI 数据中心
未来观察指标与建议
观察指标:
- 更多"非高峰时段"(UTC 凌晨)的慷慨 rate limits
- 可能出现"双倍使用额度"只在夜间可用的情况
企业建议:
- 尽可能锁定年度或更长期合同
- 假设需要的 seat 数量将远超软件工程师团队
个人用户建议:
- 不要锁定单一供应商
- Claude、OpenAI、Gemini 和开源模型之间的切换成本很低,利用这一点
洞见:关注硬件工程而非金融工程
作者认为,关于"AI 泡沫"的讨论过于关注金融工程,而硬件工程的实际情况更能说明问题。直到 2028 年新晶圆厂产能大规模上线前,推理供应约束可能会越来越严重。