Thinking#2
AI Workflow Agent
这段时间在研究AI Agent 工作流,得出了一个暴论:对于不涉及多模态、流程确定的 Workflow,DeepSeek V4 Flash 是基线模型。
这里排除自由发挥的创作或复杂编程,专指有明确输入输出的Workflow任务。在这种场景下,如果 V4 Flash 跑出来的效果差,第一步是去优化工作流,而不是急着换更强的大模型。
原因很简单,它具备了高频工作流需要的所有核心素质:1M 上下文(大部分场景不用担心 )、极速响应(用户体感极佳)、极低成本(可以更频繁的调用)。
如果一套强确定性的Workflow连 V4 Flash 都跑不通,问题 99% 出在任务拆解、Prompt、上下文管理上。
这时候直接换更强的模型,确实能把结果救回来(希望如此)。但说白了,这只是用模型的算力掩盖了Workflow 设计的缺陷。模型越强大,埋的坑就越深。
目前我开发的Workflow Agent先用 V4 Flash 跑通。跑不通就改工作流,坚决不换模型。
在目前的纯文本 Workflow 场景里,它就是最好的试金石,暂时没有之一。
Thinking#2
http://www.evec.cc/2026/06/21/small_thinking2/