智能AI morning

聊聊Harness时代AI-First的组织架构:从信任人到信任AI

2026-05-26 1 阅读 硅谷101
文 | 硅谷101 “Harness Engineering”(挽具工程)正在成为硅谷的新共识,Anthropic、OpenAI等公司都在探索这一工程范式。但真正理解Harness的人还不多。前不久,一篇题为《Why Your “AI-First” Strategy Is Probably Wrong》的文章在X上获得百万级阅读和热议,作者是来自硅谷CreaoAI的Peter Pang。在这篇文章里,Peter展示了Harness Agent系统激发出的极致效率:99%的代码由AI完成,每天平均3到8次生产部署,过去六周的产品流程,现在一天就能跑完。 本期《硅谷101》播客,主播泓君邀请到Creao的三位创始人,聊聊这家公司对Harness的实践,以及在组织AI-First转型上的深度思考。嘉宾们指出,AI-First不等于“使用AI”,想要把效率提升100倍、1000倍,就不能只把AI当成工具,而要让AI成为所有生产力的主导。组织转型最难跨出的一步在于——是否能让所有员工都能做到信任AI。 这场对话中有一些有趣的观察,比如在Creao,市场不用再追着开发提需求,因为开发速度已经远超市场消化能力;当大量对齐工作被AI接管之后,拿掉产品经理,反而让团队效率大幅提升;初级工程师比资深工程师更适应AI时代的转型;尽管过去十年积累的专长正在快速贬值,但资深工程师仍然有竞争力,因为未来的核心竞争力不再是写代码,而是“找到AI Planning的缺陷”和“判断什么是有价值的”。 以下是这次对话内容的精选: 01 Harness工程详解: 如何把大模型“榨”出极限 泓君:先请Peter介绍一下,什么是Harness engineering(挽具工程)? Peter:Harness的概念可以追溯到大模型刚开始的时候,很多人在聊prompt engineering(提示词工程),之后演变到context engineering(上下文工程),这时候更多的是聚焦在怎么和大模型本身进行交互。 但是对于Harness来讲,我们是在“驯化”一个通用的系统,所以从范围上来讲,它比prompt & context engineering要大很多,涉及到tooling(工具链)的使用,涉及到你的sandbox(沙箱)的架构设计,你的host service(宿主服务)之间是怎么进行交互的?怎么样的交互能够安全?你的sandbox在启动的时间是多少?你的延迟是多少?……这些都是harness的一部分。 泓君:可不可以理解成,Harness的工程能力决定了怎么把一个大模型“榨出”最佳使用上限?我记得Kai有提到,一个Agent可以一夜之间干掉三个人做SEO(搜索引擎优化)的工作流;同时还有一个内容流水线,它跑了两天,才有人发现全是垃圾。这两者之间有巨大区别——一个是Harness的胜利,一个是Harness的失败。 Peter:我觉得这个完全就印证了为什么我们需要Harness。 Harness的本质就是在于,我们怎么能够持续提升一个系统。 当你这个系统产生的效果不好的时候,你这个系统是需要人的feedback(反馈)去提升,还是这个系统本身自己能够self healing(自我修复)、self improvement(自我优化),这个正好就是Harness的核心。 Harness很重要的一件事情,就是怎么能够让Agent在推理阶段scaling(扩展),包括你怎么能够把更多的上下文、工具链提供给它,让它思考更长的时间,完成一个任务,用一个更长的时间。在这个阶段如果你的Harness做得不好,就很容易产生hallucination(幻觉)或者context overflow(上下文溢出),你的模型能力会降级。所以Harness是一件非常复杂而且需要一些经验的事情。 泓君:那今天市场上对Harness有哪些共识和非共识? Peter: 很多人认为Harness是静态的,就是开发配套系统发挥LLM优势。但我们认为它是一个动态的过程 ——你这个系统怎么能够从一个静态的状态真的活起来,能够self-improve(自我优化),能够不停地适配来自市场、产品、用户的各种signal,能够让它不停地、迅速地迭代。我觉得这个是可能很多人还没有意识到的一点。 泓君:这个迭代也是以AI为主导的,而不是人为主导的? Peter:对,是以AI为主导的迭代。人所需要做的事情,就是怎么把各种各样的信号feed给AI。 02 六周变一天:AI驱动的开发流程有多快? 泓君:你有一篇很火的推特帖子,讲你们25人的公司,99%的代码由AI写,早上10点写了一个功能,中午就进行了A/B test,下午3点就根据数据的反馈把它砍掉了一部分功能,5点又重写了更好的一个版本。这是一天的工作节奏,在传统的开发产品的过程中,它是需要6周的。这是你们用Harness探索出来的方式。 Peter:在我们看来,Harness分为两个部分:一是对Creao自身Agent系统的Harness,二是用户用Creao构建自己Agent时,怎么帮他Harness自己的Agent。传统开发过程中,可能要用两三个月迭代一个功能,现在AI辅助coding只需一两小时实现,如果还用很长时间去设计和测试,就不是很有意义。所以怎么把设计、规划、测试都包含到整个Harness过程中,对公司能不能转型为AI-First至关重要。 Clark:我想先跟大家表达一个观点: 如果想做到所谓的AI-First或者AI native(AI原生)这样一个状态,它不是在现有流程上去使用AI工具,而是要围绕AI能力重新构建工作流程和组织形态。 图片来源:Peter Pang@intuitiveml 我们在之前很长一段时间里,每一个工程师都在用AI写代码,每一个产品经理都在用AI写PRD(产品需求文档),每一个设计师都在用AI做图。但其实这样并没有增加我们的效率,反而导致每一个人的工作进度和节奏不一样之后,我们的alignment(对齐)成本变得非常高,我们还是全部远程办公的状态。 所以我们要去重新想,我们到底怎么样才能让AI在公司运营过程中真正地自动化跑起来,才有了Peter设计的一套新的开发流程和架构和新的产品的架构重构,才有了这篇文章里面讲的self-healing(自我修复)的Agent Harness。 泓君:可不可以举个例子,你们重塑组织架构时,哪些方向发生了变化?瓶颈在哪里? Peter: 首先需要解决人的问题——大家能否接受新工作方式。我们花很多时间对齐mindset(思维模式)。 以前做这样一个转型,通常需要一个架构师或工程师花费好几个月来demonstrate(展示)新的工作方式更优,但这个转型成本就很大。 现在在AI辅助下,这个过程就会快很多,可能只需要一两周把整个系统,包括前端、后端、架构、基础设施,都进行重构,然后给大家展示它工作起来更高效。不管是部署的频率、部署的可靠性和最后的效果上,都比之前的工作方式有很大提升。这样能在很短时间内对齐思维模式,让大家快速融入到整个开发过程。 Kai:其实Harness本身它更多是在于构建一个系统,真的能让所谓的AI-First的组织高效运转。很多组织上的人