使用自定义百炼coding plan模型,发现Qwen3.6-Plus的上下文显示只有180k,不是支持1M吗
上下文长度与推理延迟呈非线性正相关。过长的上下文会导致首字生成时间显著增加,响应变慢,严重影响用户的交互体验。限制上下文长度有助于保持流畅、快速的对话节奏等,所以我们基于多维度的综合考量,当前窗口为180k上下文