智能AI morning

GitHub 热门项目:crawl4ai

2026-05-08 1 阅读 GitHub Trending
? GitHub 项目:crawl4ai ?仓库地址:https://github.com/unclecode/crawl4ai ⭐ 星级:65216 | ? 作者:unclecode ? 项目描述:?? Crawl4AI:开源 LLM 友好的网络爬虫和爬虫。不要害羞,加入这里:https://discord.gg/jP8KfhDhyN =================================================== ? 自述文件内容: =================================================== # ?? Crawl4AI:开源 LLM 友好的网络爬虫和爬虫。 unclecode%2Fcrawl4ai | Trendshift [![GitHub Stars](https://img.shields.io/github/stars/unclecode/crawl4ai?style=social)](https://github.com/unclecode/crawl4ai/stargazers) [![GitHub Forks](https://img.shields.io/github/forks/unclecode/crawl4ai?style=social)](https://github.com/unclecode/crawl4ai/network/members) [![PyPI 版本](https://badge.fury.io/py/crawl4ai.svg)](https://badge.fury.io/py/crawl4ai) [![Python 版本](https://img.shields.io/pypi/pyversions/crawl4ai)](https://pypi.org/project/crawl4ai/) [![下载](https://static.pepy.tech/badge/crawl4ai/month)](https://pepy.tech/project/crawl4ai) [![GitHub 赞助商](https://img.shields.io/github/sponsors/unclecode?style=flat&logo=GitHub-Sponsors&label=Sponsors&color=pink)](https://github.com/sponsors/unclecode) --- #### ? Crawl4AI Cloud API — 封闭测试版(即将推出) 可靠的大规模网络提取,现在比任何现有解决方案都更具成本效益。 ? **在[此处](https://forms.gle/E9MyPaNXACnAMaqG7)申请抢先体验** _我们将分阶段上线并与早期用户密切合作。 名额有限._ --- 关注 X 在 LinkedIn 上关注 加入我们的 Discord

Crawl4AI 将网络变成干净的、适用于 RAG、代理和数据管道的 LLM 就绪 Markdown。快速、可控,经过超过 50k 明星社区的战斗测试。 [✨ 查看最新更新 v0.8.6](#-recent-updates) ✨ **v0.8.6 中的新增功能**:安全修补程序 — 由于 PyPI 供应链妥协,将 `litellm` 替换为 `unclecode-litellm`。如果您使用的是 v0.8.5,请立即升级。 ✨ 最近的 v0.8.5:反机器人检测、Shadow DOM 和 60 多个错误修复!自动 3 层反机器人检测,包括代理升级、Shadow DOM 扁平化、深度爬行取消、配置默认 API、同意弹出窗口删除和关键安全补丁。 [发行说明 →](https://github.com/unclecode/crawl4ai/blob/main/docs/blog/release-v0.8.5.md) ✨ 上一个 v0.8.0:崩溃恢复和预取模式!使用“resume_state”和“on_state_change”回调进行深度爬网崩溃恢复,以实现长时间运行的爬网。新的“prefetch=True”模式可将 URL 发现速度提高 5-10 倍。 [发布