AI之提示词
2025-04-17
一、上节课内容回顾:大模型概论
(一)大模型核心要素
算法:大模型的技术基础,如 Transformer 架构,决定模型的核心能力。
算力:关键支撑,如英伟达 GPU,推动预训练阶段的发展(2017-2023 年为主要爆发期)。
数据:模型训练的原材料,高质量、大规模数据是大模型性能的保障。
场景:决定大模型的应用价值,需与行业结合(如医疗、教育等),实现落地赋能。
(二)大模型发展阶段
预训练阶段(2017-2023 年)
核心:通过堆算力优化算法,减少训练成本。
代表:Transformer 架构提出,英伟达因算力需求崛起。
推理阶段(2023-2024 年)
核心:模型训练完成后,优化推理效率(如 OpenAI 的 ChatGPT 发布,推动大模型应用爆发)。
特点:模型参数固定,聚焦如何让模型快速、准确响应。
微调阶段(以 DeepSeek R1 为代表,当前阶段)
核心:基于成熟大模型进行微调,降低算力成本,关注数据合规与场景化落地。
趋势:企业级应用为主,结合自有数据和场景需求优化模型。
(三)大小模型对比
(四)计算题与模型分类
算力计算公式
训练时间 = 总数据量(参数 ×token 数)÷ 算力(卡数 × 单卡算力)
注:默认按 GPU 算力计算,未说明时忽略 CPU 利用率(通常 0.45)。
模型分类
按场景:基础模型(如 GPT、盘古)→ 行业模型(如医疗大模型)→ 场景模型(如智能问答系统)。
按技术架构:Transformer(主流,如 BERT、GPT)、MOE(专家混合模型,未来方向)。
二、本节课内容:提示词工程
(一)核心概念
提示词(Prompt)
定义:用户输入给大模型的指令(如 “帮我写一篇游记”),触发模型响应。
特点:单一指令,关注 “问问题 + 得结果”。
提示词工程(Prompt Engineering)
定义:系统性开发和优化提示词的学科,涉及场景设计、漏洞预防、性能提升等。
目标:让大模型更精准、安全地满足需求,如开发 AI 面试官、旅游规划助手等。
(二)提示词设计三原则
相关性
要求:指令需与目标强相关,避免无关信息干扰。
示例:问 “深度学习框架”,需明确具体框架(如 “PyTorch 和 TensorFlow 的区别”)。
确定焦点
要求:目标明确,聚焦核心需求(如 “写一篇 300 字的月度工作总结” 而非 “写一篇总结”)。
示例:“推荐三部 2023 年的科幻电影” 比 “推荐科幻电影” 更聚焦。
清晰度
要求:语言明确,避免歧义(如 “帮我算 1+1” 比 “算个数学题” 更清晰)。
示例:“用 Python 写一个冒泡排序算法” 比 “写一段代码” 更具体。
(三)提示词的四大构成要素
角色(Role)
定义:赋予模型特定身份,明确其 “职责”。
示例:开发 AI 面试官时,角色可设定为 “具有 5 年经验的 Java 技术经理,提问风格严谨但友善”。
上下文(Context)
定义:提供任务背景或用户信息,帮助模型理解场景。
示例:“我是一名预算 500 元、只有 2 天时间的大学生,想去北京旅游” 比 “帮我做北京旅游攻略” 更具体。
输入(Input)
定义:具体任务指令,需符合 “三原则”(如 “列出 HashMap 和 Hashtable 的区别”)。
输出(Output)
定义:指定输出格式或范围,提升结果可用性(如 “以表格形式输出”“控制在 200 字内”)。
示例:“用 Markdown 表格对比 Java 和 Python 的语法差异”。
(四)优化技巧与案例
技巧 1:细化用户身份
目的:让模型根据用户水平调整回答(如 “我是初中生,用通俗语言解释什么是 API”)。
效果:避免答案过于专业或抽象,提升可读性。
技巧 2:分步骤提问
方法:将复杂问题拆解为多个子问题(如 “第一步,分析用户需求;第二步,设计解决方案”)。
示例:开发旅游 App 时,先问 “用户可能的预算范围”,再问 “推荐对应预算的景点”。
技巧 3:增加约束条件
方法:限定输出范围(如 “推荐三部豆瓣评分 8.5 以上的国产电影”)。
效果:减少无关结果,提升精度。
技巧 4:示例引导
方法:提供参考格式或案例(如 “请模仿以下风格写文案:[示例内容]”)。
示例:“用小红书风格写一篇福州旅游笔记,包含美食和景点推荐”。
技巧 5:多轮对话与思维链
方法:通过多轮互动逐步明确需求(如 “刚才的方案预算超支,能否调整为 500 元以内?”)。
效果:让模型理解用户深层需求,如性价比优先。
(五)实战案例:旅游 App 功能 AI 化
角色设定
“你是一位资深旅游规划专家,擅长根据用户预算、时间和偏好设计个性化行程,熟悉北京景点、交通和美食。”
上下文
“用户是一名大学生,预算 500 元,周末 2 天时间,偏好历史文化景点,希望行程经济实惠。”
输入
“推荐北京周末 2 日游行程,包含故宫、天安门等历史景点,预算控制在 500 元内,含交通和餐饮建议。”
输出
“以表格形式输出每日行程,标注景点开放时间、门票价格、交通方式和推荐美食(人均 50 元内)。”