PostsMapsLinks
Politics

AI 计算资源危机

AI 算力供应紧张对行业 adoption 的影响分析

核心论点:AI 算力危机已经到来

作者 Martin Alderson 认为,AI 计算资源危机不是"即将到来",而是已经到来。供应链难以跟上需求增长,这是一个被严重低估的风险,将对未来一到两年的 AI 普及产生重大影响。

见:Is the AI Compute Crunch Here?

供应端 struggling 的证据

Anthropic 的服务降级

  • 2025 年 3 月,Claude 系列服务 uptime 降至 "one 9"(约 90%)
  • 官方承认这是"前所未有的增长"导致,难以预测
  • 被迫采取降质措施:降低默认 effort 级别、移除旧模型访问、禁用 prompt 建议

行业普遍问题

  • OpenRouter 上整个行业的可靠性都很差
  • 阿里云 CEO 表示:"我们部署新服务器的速度跟不上客户需求的增长"
  • 4 个月后,情况依然严峻

Agentic AI 的拐点效应

2025 年秋季以来,模型能力(尤其是 Opus 4.6 和 GPT 5.4)在软件工程任务上取得突破,导致:

  • 更多复杂流程适合 agentic 模型(从构建 C 编译器到解决数学算法问题)
  • Agentic 流程消耗 token 的速度远超其他 LLM 用途

渗透率数据

  • Claude Code 年收入 25 亿美元,估算约 200-300 万付费用户
  • 相比 OECD 2-3 亿专业/管理工作者,渗透率仅 1-2%
  • 企业采用仍处于试点阶段,全面部署将带来巨大需求增长

硬件层面的硬约束

DRAM 供应瓶颈

  • 作者估算,DRAM 供应对 AI 基础设施设置了一个约 15GW 的硬上限,直到 2027 年
  • DDR5 内存价格从 2025 年 5 月的 $110 涨至 12 月的 $415
  • HBM(高带宽内存)与 DDR5 争夺同一上游晶圆产能

数据中心建设的真实阻碍

  • 许多报道中的"融资问题"或"投资者犹豫",实际是电力、计算资源、内存和建筑劳动力短缺
  • 无论 Oracle、Softbank 或 Codeweaves 投入多少资金,在供应改善前都无法建成新的 AI 数据中心

未来观察指标与建议

观察指标

  • 更多"非高峰时段"(UTC 凌晨)的慷慨 rate limits
  • 可能出现"双倍使用额度"只在夜间可用的情况

企业建议

  • 尽可能锁定年度或更长期合同
  • 假设需要的 seat 数量将远超软件工程师团队

个人用户建议

  • 不要锁定单一供应商
  • Claude、OpenAI、Gemini 和开源模型之间的切换成本很低,利用这一点

洞见:关注硬件工程而非金融工程

作者认为,关于"AI 泡沫"的讨论过于关注金融工程,而硬件工程的实际情况更能说明问题。直到 2028 年新晶圆厂产能大规模上线前,推理供应约束可能会越来越严重。

Copyright © 2024 Lionad - CC-BY-NC-CD-4.0