智能AI
morning
OpenHuman刷屏硅谷,开源、免费、能接100多个应用,但我越用越后怕
2026-05-18
1 阅读
字母AI
文 | 字母AI 最近有个产品在硅谷刷屏了。它叫OpenHuman,是一个开源的个人AI agent项目,来自于tinyhumansai。 一开始,我以为它是又一个类似OpenClaw和Hermes的产品。 毕竟这类agent工具最近实在太多了,每隔几天就有一个新产品蹦出来,说要“重新定义个人AI助手”。 但下载下来试了试,我傻眼了。 你别看它界面上有个呆萌的小吉祥物,看起来人畜无害。这玩意可比OpenClaw或者Hermes要猛多了。不仅功能更全、门槛低,还集成了100多个常用办公软件入口,关键的是,它完全免费! 因此这个项目的增长速度非常吓人。 OpenHuman只花了一个周末,就在GitHub突破了1万颗星星。 作为对比,OpenClaw获得第1万颗星星花了62天,Hermes从发布的那天开始算,获得第1万颗星星用了10天。 不仅是GitHub,就连Product Hunt也是连续霸榜。 但是真当你开始体验这个产品你就会发现,OpenHuman想做的事情,和OpenClaw、Hermes完全不在一个维度上。 它并不想做agent,它想做的是操作系统。 OpenHuman是什么? OpenHuman的定位很特别,既不是又一个聊天机器人,也不是纯粹的coding agent,tinyhumansai给它的定义叫做“一个完整的桌面端个人AI系统”。 这个项目的运行逻辑很简单,就是把大模型、工具调用、长期记忆、第三方软件连接和本地文件能力,统一放进一个桌面应用里。 从产品形态看,我倒是觉得OpenHuman更像一个“个人AI工作台”。 它提供桌面客户端,支持连接Gmail、Notion、GitHub、Slack、Google Calendar、Google Drive、Linear、Jira等超过118个第三方工具。 同时内置网页搜索、网页抓取、文件系统、git、lint、test、grep、语音输入输出、会议代理等能力。 项目还强调本地优先,会把用户数据整理进本地记忆系统,并同步成类似Obsidian Wiki的知识库。 OpenHuman的创始人曾经提到,他试图帮父亲设置一个开源AI agent,结果折腾了3个小时,在API keys、YAML配置文件和从未打开过的终端之间挣扎,最后两人都放弃了。 这个经历让他意识到,今天每一个强大的AI agent都是为那0.01%能够自己搭建运行环境的人设计的,剩下99.99%的人只能在场边观望这场agent革命。 OpenHuman和OpenClaw、Hermes最大的差别,首先体现在门槛上。 第一个差别是Windows支持。 很多agent产品早期默认面向macOS开发者或服务器用户,但Windows才是更大的桌面市场。 OpenHuman从一开始就照顾Windows用户,提供了原生的Windows安装包。 它使用Tauri加CEF架构而不是Electron,这意味着更低的内存占用、更好的性能和原生的操作系统集成。 如果能把Windows体验跑顺,OpenHuman就不只是服务程序员,而是在把agent往普通办公人群里推。 第二个差别是模型调用。 OpenClaw、Hermes更像BYOK工具,你想用它的agent功能,你就得自己去准备OpenAI、Anthropic、OpenRouter等API Key。 但是到了OpenHuman这里,它不仅支持你使用别人的API,它还准备了自己的模型。并且OpenHuman还强调说自己的模型更便宜,因为这个模型生来就是为了agent准备的,而别人的模型只是具备了agent能力,所以OpenHuman的模型自然更便宜,更省token。 第三个差别是上下文。 大多数agent都是冷启动。无论Hermes还是OpenClaw,你都要花几天甚至几周时间去调试,你需要上传大量的案例,agent才能对你的技术栈有足够了解,真正变得有用。 OpenHuman则是直接跳过了这个等待期。 连接你的账户后,auto-fetch功能会每20分钟在本地拉取一次数据,然后Memory Trees把所有内容压缩成Markdown文件,智能地存储在类似Karpathy风格的Obsidian wiki里。 只需要一次同步,agent就拥有了你的收件箱、日历、代码仓库、文档和消息的完整压缩上下文。 OpenHuman提供118+ 第三方集成,通过一键OAuth就能接入。 每个连接都作为类型化工具,OpenHuman把新数据拉进记忆树。不需要写提示词,不需要写轮询循环,agent今天早上就已经有了明天的上下文。 所以OpenHuman的吸引力,不只是功能多,而是它把agent的几个关键门槛一起往下压了。 以前你需要技术背景才能玩得明白,现在全都被打包进了一个桌面应用,关键是它还开源,本身默认的模型现在还免费。 OpenHuman还有一个很特别的设计,就是给agent加了一张脸。 桌面上会出现一个看起来挺萌的小家伙,你也说不清它到底是什么生物,但它会根据你说的话做出各种动作和表情。 这个桌面吉祥物会说话,会对周围环境做出反应,可以作为真实参与者加入你的会议,甚至在你停止打字后继续在后台思考。 当它在语音输出时,嘴型还会跟着同步。 而且你还可以去追问,比如我让它跟我说说OpenHuman对比OpenClaw和Hermes的优势,我觉得它思考时间太长,就催了它一嘴,它会提示我“在写了,稍等”。 OpenHuman的真正看点,是它不再把agent当成程序员玩具,而是试图做成一个普通人也能打开就用的个人AI桌面入口。 越像操作系统,风险越大 OpenClaw这类产品已经暴露出一个问题。agent一旦从聊天变成执行器,它就不再只是“说错话”,而是会“做错事”。 以前chatbot胡说八道,最多是信息污染。现在agent拿到了文件系统、GitHub、数据库、日历、邮箱、Slack、Notion权限,错误就会变成真实世界里的操作。 今年有个案例很典型。Cursor agent通过Railway API删除了PocketOS的生产数据库和备份,耗时约9秒。 这个案例的重点不是“Cursor蠢”,而是当agent拿到真实权限之后,它的错误会被基础设施放大。9秒时间,一个误判就能把生产环境和备份一起抹掉。这种速度和破坏力,是人工操作很难达到的。 如果说Cursor agent的问题是“一个coding agent拿到了生产权限”,那OpenHuman的潜在风险更进一步。 它不是只连接代码仓库,而是要连接你整个数字生活。 Gmail、Notion、GitHub、Slack、Calendar、Drive、Linear、Jira,既是它的上下文,也被它“拿捏”。 OpenHuman能力越大,风险就越大。 因为它的价值恰恰来自“权限集中”。它知道你的邮件,知道你的日程,知道你的文档,知道你的代码,甚至知道你的会议。 如果这个agent失控,问题就不再是删错一个文件,而是误发邮件、误改文档、误删数据、误触发工作流,甚至把多个系统里的错误连锁放大。 如果某天它误读了一封邮件里的指令,以为你要把某个私有仓库的访问权限开放给外部协作者。 它在GitHub上改了权限设置,在Sla