针对最近有网友测试发现,语言模型 Claude 2.1 在长文本任务中表现出现“遗忘”现象,Anthropic 公司做出正式回应。他们指出,通过简单的提示工程(Prompt Engineering),就可以将 Claude 的文本记忆能力大幅提升。

具体来说,在 Claude 的回复开头添加“这里是上下文中最相关的句子:”这一提示,Claude 2.1在记忆测试中的得分从 27% 暴涨至 98%。Anthropic 解释称,这种“遗忘”现象的起因是 Claude 会不愿意据单个句子来回答问题,特别是当那个句子与上下文不搭配时。提示工程成功地减轻了这种倾向,让 Claude 充分发挥出强大的长文本处理实力。

Anthropic 表示,通过持续优化训练,他们正在努力提升 Claude 在这类任务上的校准度,也感谢社区的测试与反馈,让 Claude 变得更加强大。

相关阅读  VideoPoet: 谷歌的视频生成模型

Categorized in: