智能AI
morning
GitHub 热门项目:crawl4ai
2026-05-08
1 阅读
GitHub Trending
? GitHub 项目:crawl4ai
?仓库地址:https://github.com/unclecode/crawl4ai
⭐ 星级:65216 | ? 作者:unclecode
? 项目描述:?? Crawl4AI:开源 LLM 友好的网络爬虫和爬虫。不要害羞,加入这里:https://discord.gg/jP8KfhDhyN
===================================================
? 自述文件内容:
===================================================
# ?? Crawl4AI:开源 LLM 友好的网络爬虫和爬虫。
[](https://github.com/unclecode/crawl4ai/stargazers)
[](https://github.com/unclecode/crawl4ai/network/members)
[](https://badge.fury.io/py/crawl4ai)
[](https://pypi.org/project/crawl4ai/)
[](https://pepy.tech/project/crawl4ai)
[](https://github.com/sponsors/unclecode)
---
#### ? Crawl4AI Cloud API — 封闭测试版(即将推出)
可靠的大规模网络提取,现在比任何现有解决方案都更具成本效益。
? **在[此处](https://forms.gle/E9MyPaNXACnAMaqG7)申请抢先体验**
_我们将分阶段上线并与早期用户密切合作。
名额有限._
---
Crawl4AI 将网络变成干净的、适用于 RAG、代理和数据管道的 LLM 就绪 Markdown。快速、可控,经过超过 50k 明星社区的战斗测试。
[✨ 查看最新更新 v0.8.6](#-recent-updates)
✨ **v0.8.6 中的新增功能**:安全修补程序 — 由于 PyPI 供应链妥协,将 `litellm` 替换为 `unclecode-litellm`。如果您使用的是 v0.8.5,请立即升级。
✨ 最近的 v0.8.5:反机器人检测、Shadow DOM 和 60 多个错误修复!自动 3 层反机器人检测,包括代理升级、Shadow DOM 扁平化、深度爬行取消、配置默认 API、同意弹出窗口删除和关键安全补丁。 [发行说明 →](https://github.com/unclecode/crawl4ai/blob/main/docs/blog/release-v0.8.5.md)
✨ 上一个 v0.8.0:崩溃恢复和预取模式!使用“resume_state”和“on_state_change”回调进行深度爬网崩溃恢复,以实现长时间运行的爬网。新的“prefetch=True”模式可将 URL 发现速度提高 5-10 倍。 [发布