Thinking#2

AI Workflow Agent

这段时间在研究AI Agent 工作流，得出了一个暴论：对于不涉及多模态、流程确定的 Workflow，DeepSeek V4 Flash 是基线模型。

这里排除自由发挥的创作或复杂编程，专指有明确输入输出的Workflow任务。在这种场景下，如果 V4 Flash 跑出来的效果差，第一步是去优化工作流，而不是急着换更强的大模型。
原因很简单，它具备了高频工作流需要的所有核心素质：1M 上下文（大部分场景不用担心）、极速响应（用户体感极佳）、极低成本（可以更频繁的调用）。

如果一套强确定性的Workflow连 V4 Flash 都跑不通，问题 99% 出在任务拆解、Prompt、上下文管理上。
这时候直接换更强的模型，确实能把结果救回来（希望如此）。但说白了，这只是用模型的算力掩盖了Workflow 设计的缺陷。模型越强大，埋的坑就越深。

目前我开发的Workflow Agent先用 V4 Flash 跑通。跑不通就改工作流，坚决不换模型。
在目前的纯文本 Workflow 场景里，它就是最好的试金石，暂时没有之一。

#AI

Thinking#2

http://www.evec.cc/2026/06/21/small_thinking2/

作者

前夕

发布于

2026年6月21日

许可协议

iPhone Air 体验报告：一次关于减法的成功实验下一篇