图文 · 01 / 01
大模型到底在生成什么
为什么重要
很多人把大模型当成“会聊天的搜索引擎”,于是会期待它永远给出确定答案。更准确的理解是:模型根据上下文预测下一段最合适的内容。
核心点
- 输入是上下文:系统提示、用户问题、历史消息和外部资料都会影响输出。
- 输出是生成:模型不是从数据库里复制答案,而是一步步生成 token。
- 概率不是事实:最像答案的内容不一定是真的,所以需要检索、引用和验证。
- 指令会改变分布:清晰的角色、目标、约束和格式,会让输出更稳定。
常见误区
- 把模型说得流畅等同于说得正确。
- 用一句模糊问题,期待模型自动理解完整业务背景。
- 只调提示词,不补资料、不加验证、不设计流程。
学习/实践建议
- 先把模型当成“强大的文本生成器”,再用资料、工具和流程把它约束成可靠系统。
- 写提示词时至少说明四件事:任务是什么、背景是什么、不能做什么、输出长什么样。