提示工程 (Prompt Engineering)

DSPy：声明式提示编程框架

DSPy 是斯坦福 NLP 团队开源的框架，将提示工程从"手工调优"转变为"编程优化"。核心抽象包括 Signature（声明输入输出语义）、Module（可组合的计算单元）、Optimizer（自动优化提示和权重）、Teleprompter（少样本示例编译器）。开发者只需描述任务逻辑，DSPy 自动优化提示词、选择示例、微调小模型，在多跳问答等任务上超越手工提示。

见：DSPy GitHub | DSPy 文档 | DSPy 论文

Instructor：结构化输出解析库

Instructor 基于 Pydantic 构建，解决 LLM 输出结构化的问题。通过定义数据模型类，自动将 LLM 的文本响应解析为强类型对象，内置重试、验证、流式处理。支持 OpenAI、Anthropic、Gemini 等主流模型，是生产环境中类型安全调用 LLM 的首选方案。

见：Instructor GitHub | Instructor 文档

Guidance：约束生成控制模板

Guidance 提供模板语法控制 LLM 的生成过程，支持在生成中强制特定格式（JSON、正则匹配）、动态选择分支、变量插值。通过控制流与生成交错，大幅减少无效输出和后续解析失败，适合需要严格输出格式的场景。

见：Guidance GitHub

Outlines：可靠的文本结构化生成

Outlines 通过预编译正则表达式或 JSON Schema 到高效索引结构，实现完全符合格式的生成。与 Guidance 相比更轻量、性能更高，支持批量生成和多种模型后端，是结构化生成的现代替代方案。

见：Outlines GitHub | Outlines 文档

工具选型指南

选择取决于控制粒度：Instructor 适合"解析已知格式的响应"，Pydantic 验证确保类型安全；Guidance/Outlines 适合"强制模型按格式生成"，从源头约束输出结构。DSPy 则用于系统级优化，自动迭代提示策略。实际项目中常组合使用：Outlines 控制格式，Instructor 验证解析，DSPy 优化整体流程。

见：DSPy vs Instructor 对比 | Outlines vs Guidance 性能对比

提示工程实践技巧

利用上下文窗口优于依赖模型记忆

当需要模型处理特定内容时，直接将其粘贴到提示中，而非依赖模型的"知识"。例如，与其问"总结《傲慢与偏见》第一章"，不如将第一章文本粘贴到提示中再要求总结。当内容在上下文窗口中时，模型拥有直接访问权，生成的质量显著高于依赖记忆召回。

使用分隔符组织多部分输入

当提示包含多个部分（指令、背景、参考资料）时，使用清晰的分隔符（如 ---、XML 标签）帮助模型区分不同区域：

请总结以下文本：

---
[粘贴的文本内容]
---

思考型模型的选择策略

不同模型适合不同任务类型：

普通模型（GPT-4o、Claude Sonnet）：适合创意写作、一般问答、日常对话
思考型模型（o3-mini、o1）：适合数学、代码、逻辑推理等需要深度思考的任务

思考型模型通过强化学习训练，会在回答前进行内部"思考链"推理。但对于创意类任务，这种思考不一定带来提升，反而可能让输出显得过于机械。

见：How I use LLM - Andrej Karpathy

后训练 (Post-Training)

Context Engineering

Context Engineering 是一种优化与大型语言模型（LLM）交互的技术，旨在通过提供结构化和相关的上下文信息，提高模型生成内容的准确性和相关性。