Llm

小型语言模型(SLM)

small language models related

Brief

在多期《技术雷达》中,我们持续观察到小型语言模型(SLM)的稳步发展。随着构建智能体(Agentic)解决方案的兴趣日益增长,我们看到越来越多证据表明,SLM 可以高效支撑智能体式 AI。当前大多数智能体工作流都聚焦在范围较窄、重复性高、且不需要复杂推理的任务上,这类任务与 SLM 的能力非常匹配。

Phi-3、SmolLM2 和 DeepSeek 等 SLM 的持续进步表明,对于这些任务而言,SLM 已经具备足够的能力——同时相较于大型语言模型(LLM),还能带来更低成本、更低延迟以及更少资源消耗等附加优势。因此,在设计智能体工作流时,将 SLM 作为默认选型是值得考虑的做法,而将规模更大、资源占用更高的 LLM 仅保留给确有必要的场景。

来源:技术雷达


Copyright © 2024 Lionad - CC-BY-NC-CD-4.0