最近在看一圈 ToB agent 的落地情况,有个判断越来越清晰:
至少还得 1 年,国内 ToB agent 才可能真正起来。
第一,国内的模型能力,还不够。
ToB 业务链条长、场景复杂、对结果的容错率极低。
现在的大模型,哪怕再微调十遍,稳定性不够,自洽性不够,还不够听话这些问题依然严重。
prompt 写得挺对,它干的事还是不怎么靠谱。像个刚转岗的实习生,流程懂了点,但是做起来全是 bug。
第二,做技术和懂业务的,不是一拨人。
ToB agent 最大的挑战是知识怎么迁移。比如想让 agent 搞懂保险理赔、医疗问诊、法律审查……这些不是写 prompt 能解决的,它们背后是几十年经验、人情流程和模糊判断。
越值钱的知识,掌握它的人越年长,越难被结构化表达,更别说这批人愿不愿意倾囊相授。
技术今天搞出来一个 agent,业务方只会说三句话:你这不准啊、我们流程不是这样的、你这漏了关键条件,但这个流程是之前开发跟业务一起梳理出来的。
这背后藏了抵触,技术和业务之间,隔着的不是 AI,是一整座山。
那为什么 AI coding 能先跑出来?因为这事里最懂业务的就是技术自己。
谁最懂代码结构?技术!
谁能写 agent 调 agent?技术!
谁能 debug agent?还是技术!
技术是唯一一拨能自己用,自己调 bug的群体。业务等于本体,没有认知 gap,也不需要跨专业翻译,一整个闭环自然就跑通了。
本质区别在这:AI coding 是单边迁移服务自己, ToB agent 是双边博弈,需要认知共建。一个能快,一个必须慢。
对于 AI coding,只要模型理解开发者就够了。ToB agent,不仅模型要懂业务,开发者还得懂业务,然后两边还得对得上话。
这,太难了。
真正的转折点要出现:必须满足模型能稳定 编码行业知识,Agent 能封装复杂动作并处理结果反馈(前提是老顽固们愿意掏心窝),企业能放心把核心流程交出去。
到那一天,ToB 才真正算是 ready 了。
那时候再回头看 coding agent 的进化速度,也许已经不是一个量级的对比了。
技术在革自己命这件事上,从来没有输过任何群体。