在人工智能时代, 大型语言模型 (LLMs) 正在改变我们与计算机互动的方式。然而, 要让这些 AI 助手真正理解我们的需求并产生所需的输出, 一个关键挑战浮现出来 - 如何有效地"提示"它们。
IBM 研究院的一个团队最近提出了一种创新方法, 旨在让这个过程变得更加简单和个性化。他们称之为"对话式提示工程"(Conversational Prompt Engineering, CPE) 。
提示工程:AI 时代的新技能
提示工程, 即设计和优化用于指导 AI 模型的指令, 已经成为一项至关重要的技能。然而, 这个过程往往耗时费力, 需要深入理解 AI 的工作原理。
"即使对经验丰富的从业者来说, 提示工程也是一项复杂的任务,"IBM 研究团队在他们发表于 arXiv 的论文中指出,"它需要深入理解 LLMs 如何解释和响应指令, 以及预测措辞或上下文的细微变化如何影响输出。"
这种复杂性限制了提示工程的广泛应用, 特别是对于那些没有 AI 专业知识的用户。
CPE: 让 AI 理解你的需求
为了解决这个问题,IBM 团队开发了 CPE 。这个工具利用聊天模型与用户进行简短的交互, 帮助他们清楚地表达对 AI 输出的偏好, 并将这些偏好整合到最终的提示中。
CPE 的工作流程包括两个主要阶段:
- 初始指令形成: 系统使用用户提供的未标记数据生成数据驱动的问题, 并利用用户的回答来塑造初始指令。
- 指令和输出优化: 系统展示由指令生成的输出, 并使用用户反馈进一步细化指令和输出。
最终结果是一个包含少量示例的提示, 其中用户批准的输出作为示例。
"CPE 的独特之处在于它不需要标记数据或初始提示,"研究团队解释道,"它通过自然对话帮助用户明确他们的任务需求, 并将这些需求转化为有效的 AI 指令。"
实践证明:CPE 的效果
为了验证 CPE 的有效性, 研究团队进行了一项用户研究, 专注于文本摘要任务。 12 名在提示工程方面有丰富经验的研究人员参与了这项研究。
参与者与 CPE 进行对话, 表达他们对摘要生成的特定要求。然后, 他们评估了使用 CPE 生成的提示与基线提示的表现。
结果令人鼓舞。大多数参与者认为 CPE 有助于创建符合他们要求的提示。更重要的是,CPE 生成的摘要通常优于基线提示。
"令人惊讶的是,CPE 生成的零样本提示与包含具体例子的少量样本提示在用户满意度上表现相当,"研究团队表示,"这表明 CPE 能够有效地捕捉和整合用户偏好, 即使没有具体例子也能生成满意的输出。"
未来展望:CPE 的潜力
虽然 CPE 显示出了巨大的潜力, 但研究团队也指出了一些需要进一步探索的方向。
一个关键问题是如何提高 CPE 的收敛速度。在用户研究中, 平均需要 25 分钟才能生成最终的提示。研究团队计划在未来的工作中解决这个问题。
另一个有趣的方向是将 CPE 与其他自动化提示工程方法结合。研究团队提出,CPE 生成的提示可能成为这些方法的理想起点, 进一步提高提示的效果。
此外, 研究团队还计划探索 CPE 在其他领域的应用, 如帮助用户规划和创建 AI 代理工作流程。
结语:AI 时代的新工具
随着 AI 技术的快速发展, 如何有效地与这些强大的系统沟通成为一个关键问题。 CPE 为这个问题提供了一个创新的解决方案, 让普通用户也能轻松地指导 AI 完成复杂任务。
虽然还有许多需要改进的地方, 但 CPE 无疑代表了 AI 交互的未来方向。它不仅使提示工程变得更加容易, 还为个性化 AI 体验开辟了新的可能性。
在未来, 我们可能会看到类似 CPE 的工具被广泛应用于各种 AI 互动场景, 从企业客户服务到个人助理。这将使 AI 技术更加平民化, 让更多人能够充分利用 AI 的力量。
正如 IBM 研究团队所言:"CPE 不仅是一个工具, 它代表了一种新的思维方式 - 如何让 AI 更好地理解和满足人类的需求。"
(参考文献: Ein-Dor, L. , Toledo-Ronen, O., Spector, A., Gretz, S., Dankin, L., Halfon, A., … & Slonim, N. (2024). Conversational Prompt Engineering. arXiv preprint arXiv:2408.04560.)✅