智能AI morning

大模型首选格式Markdown,被30年前的工具取代了?

2026-05-11 1 阅读 字母AI
文 | 字母AI 我才刚开始用Markdown不到一年,怎么现在Markdown就要被淘汰了? 事情经过是这样的,Claude Code团队成员Thariq在X上发表了一篇文章,标题叫《Using Claude Code: The Unreasonable Effectiveness of HTML》。 他说他自己现在已经完全停用Markdown了,转而用HTML作为AI输出的默认格式。 不是,先等一会的,Thariq的观点让我更糊涂了。 你说Markdown格式过时这我还能理解,毕竟这几年用下来,或多或少我也能说出点Markdown的缺点。可是要用HTML去替换Markdown……这玩意比Markdown还早诞生了10多年啊! 本身Markdown就是因为HTML不好用才诞生的,怎么现在反过来要被HTML替代了呢? 所以,要搞清楚Thariq的逻辑,咱们得先从Markdown这个格式本身说起。 它到底是个什么东西?为什么这么多人在用?又为什么现在突然就不够用了? 01 Markdown是怎么来的,为什么现在又要被淘汰? 2004年,约翰·格鲁伯(John Gruber)与亚伦·斯沃茨(Aaron Swartz)共同设计了Markdown。 他们要解决的痛点很明确,那就是写博客。 2004年前后,博客正在兴起,但当时的博客平台像WordPress、TypePad的编辑器功能很有限。格鲁伯自己写 Daring Fireball 博客时,每次发文章都得手写HTML代码,这些标签写到烦。 如果从Word复制粘贴,又会带来一堆乱七八糟的格式代码,在不同浏览器里显示还会出问题。 格鲁伯想要的很简单,就是一种“看起来像普通文本,但能自动转成网页”的格式。 写作者只需要打字,不用记那些 HTML 标签,不用在可视化编辑器和代码视图之间来回切换,写完直接发布。 于是,Markdown就是这样诞生的。用 #表示标题 ,用*表示列表,用**表示加粗,几个符号就够了。 最巧妙的地方,是即使不转换成网页,你也能通过这些符号,能明白哪里是标题,哪里是重点。 通过Jekyll、Hexo这些工具,就可以用Markdown来写博客,然后一键生成静态网站。 随后,技术博客平台比如Medium、Dev.to也开始支持Markdown写作。 久而久之,整个技术社区形成了“默认用Markdown”的集体习惯。 不过Markdown爆火并不是因为这事,其实Github才是它的第一推手。 当GitHub将Markdown作为README标准,整个开源社区一夜之间有了统一的文档语言。 README 是一个文档文件,用于介绍项目的基本信息、使用方法、安装步骤等内容,是项目的说明书。它一般是访问者打开项目时首先看到的文档。 程序员们发现,用Markdown写文档比用纯文本清晰,比用Word方便,比用HTML简洁。 更重要的是,Markdown是纯文本格式,可以完美融入Git等版本控制系统。 每次修改都能清晰追踪diff,这对程序员来说简直是刚需。 以前README常用txt格式,但是txt没办法像Markdown一样能给人直观的感受。你打开一个txt文件,除了文字还是文字,没有任何结构提示。 但Markdown不一样, 即使不渲染,你也能认清 #号 、*号以及普通文字的区别。 接下来就是各类笔记软件。 Bear、Obsidian、Notion这些工具都把Markdown作为底层格式。 用Markdown记笔记有一个好处,你可以把这个笔记放在任何一种文本编辑器里面打开和编辑,不需要编程软件,也不会因为软件版本或平台差异而出现兼容性问题。 你今天用Obsidian写的笔记,明天可以用VS Code打开,后天可以用Typora编辑,大后天可以用Vim修改。 Word就不行。你用Word写,你就只能用Word类的工具打开,普通记事本工具都没办法打开。 而且97-2003版本的.doc文件,和2007版本以后的.docx文件还有差别,如果使用SmartArt、高级图表这些功能,那文件就不能以.doc命名,否则再次打开的时候就会显示错误。 程序员们非常喜欢用Markdown,还有一个原因是它原生支持代码块语法高亮。 用三个反引号加语言名,就能在文档里插入代码示例。这让程序员可以在同一份文档里无缝混合文字说明和代码示例。 到了AI时代,Markdown又成为了大语言模型的首选格式。 原因很简单,它语法简单、token开销低,非常适合大语言模型生成和解析。 而且结构清晰,便于模型在训练中学习标题、段落、列表的层次语义。 关键是它对人类友好,我们能直接看懂Markdown格式的原文。 ChatGPT、Claude、Gemini这些模型在回答问题时,默认都用Markdown格式输出。程序员用的Cursor、Windsurf、Cline、Aider这些编程Agent,也都把Markdown作为标准输出格式。 从一个小众的写作格式,变成了整个技术社区的通用语言,再到现在,Markdown成为了AI时代的标准输出格式。 那为啥要淘汰Markdown呢? Thariq给出的原因是Markdown只能表达基础文档结构,无法原生承载表格样式、SVG插图、交互组件、空间布局等富媒体信息。 Claude在Markdown里不得不用ASCII画图、用Unicode字符估算颜色。 Thariq在文章里贴了一张截图,Claude试图用Unicode字符来表示颜色。 这就像让你你去画一幅油画,但只给你一支铅笔。你可以用铅笔画出明暗关系,但那终究不是油画。 更关键的问题是,当Agent能一次性产出数百行的规格文档、实现方案、研究报告时,纯文本的Markdown就没办法阅读了。 Thariq坦言自己基本不会读超过100行的Markdown文件,他的同事们也不会。 这不是他懒,这是人类认知的极限。 当一份文档超过一定长度,如果没有视觉层次、没有颜色编码、没有可折叠的区块,你的大脑就会自动放弃处理。你会滚动鼠标,假装自己在看,但其实什么都没看进去。 最后一个问题,Thariq认为也是最致命的问题。 Markdown原本的优势之一是人类方便手改,但在agent工作流里,用户越来越少亲自编辑文件,而是让Claude去改。 这让Markdown易于手写的核心优势在当下变得无关紧要。 你想想,如果你不需要自己写Markdown,只需要看Claude生成的结果,那Markdown的简洁语法还有什么意义? 反而是它的表达能力不足,成了最大的短板。 所以Thariq的结论是,Markdown在AI时代已经不够用了。 它曾经是最好的选择,但现在它的优势正在消失,而它的劣势正在放大。 02 HTML这么古老,为什么反而要来淘汰Markdown? HTML至今已有30多年历史,比Markdown早了整整10多年。 它是万维网的底层文档语言。 从一开始,HTML就是为了在网页上展示各种内容而生的。你可以点击链接跳转、可以嵌套多层结构、可以插入图片视频、可以添加交互按钮,正是因为HTML。 Markdown是为了让写作更简单而生的,它的本质是做减法,只保留最基础的文档结构。 HTML是为了让表达更丰富而生的,它