问题背景
在处理复杂项目时,我通常会在同一个会话中与 Agent 进行多轮交互,逐步积累业务上下文(如项目架构、技术栈、业务逻辑等)。随着对话越来越长,即使后续只是一个简单的需求(比如改一个配置、加一个字段),Credit 消耗也非常高------因为每次请求都需要携带完整的长上下文。
如果选择新开会话来降低 Credit 消耗,新的会话就丢失了之前积累的所有业务知识,Agent 需要重新理解项目背景,效率大幅下降,甚至可能因为上下文缺失而给出错误的结果。
这就形成了一个两难困境:留在长对话里 Credit 消耗高,开新会话则丢失上下文。
期望方案
希望能支持****会话级别的上下文迁移(Context Transfer)****,具体来说:
1. **上下文摘要与继承**:在开启新会话时,能够基于前一个会话的对话历史,自动生成一份结构化的上下文摘要(包含项目背景、已完成工作、关键决策、当前状态等),并将其作为新会话的初始上下文注入。
2. **用户可控的迁移粒度**:允许用户选择迁移哪些上下文------例如只迁移项目架构相关的知识,而丢弃与当前任务无关的闲聊或过时的讨论。
3. **Credit 消耗与上下文长度脱钩**:通过上下文压缩/摘要机制,让新会话在继承关键业务知识的同时,保持较短的有效上下文长度,从而大幅降低 Credit 消耗。
理想体验
- 在长对话中完成一个阶段后,我可以点击「新开会话,保留上下文」之类的按钮。
- 系统自动总结前一个会话的关键信息,生成一份精简的上下文 Brief。
- 新会话启动时,Agent 已经了解项目背景和当前进度,可以无缝继续工作,而 Credit 消耗回到较低水平。
为什么重要
这个功能直接影响了重度用户的使用体验和成本。目前长对话场景下的 Credit 消耗是一个实际的使用痛点,用户不得不在「省钱」和「保持上下文」之间反复权衡。如果能实现上下文迁移,既能让用户获得更好的使用体验,也能让 Agent 始终保持高质量的上下文理解,是一个双赢的改进。