智能AI
morning
SciAtlas:用于自动化科学研究的大规模知识图谱
2026-05-25
1 阅读
Shuofei Qiao, Yunxiang Wei, Jiazheng Fan, Bin Wu, Busheng Zhang, Mengru Wang, Yuqi Zhu, Ningyu Zhang, Keyan Ding, Qiang Zhang, Huajun Chen
arXiv:2605.22878v1 发布类型:新 摘要:全球学术成果的指数级增长使研究人员和人工智能代理面临前所未有的“信息爆炸”,碎片化和非结构化的知识组织阻碍了深度的跨学科融合。当前的学术检索工具主要依赖于肤浅的关键词匹配或向量空间语义检索,缺乏导航复杂逻辑连接所需的拓扑推理能力。基于代理深度研究的框架往往容易产生逻辑幻觉并消耗较高的推理成本。为了弥补这一差距,在本报告中,我们引入了 SciAtlas,这是一个大规模、多学科、异构学术资源知识图谱,设计为全景科学演化网络。通过整合来自 26 个学科的超过 4300 万篇论文以及总共 1.57 亿个实体和 3B 三元组,SciAtlas 提供了一个结构化的拓扑认知基础,消除了学科障碍,并为 AI 代理提供了全球视角。此外,我们开发了一种神经符号检索算法,具有三路径协作召回和图重排序的特点,实现了从简单语义匹配到确定性关联发现的无缝过渡。我们还提出了SciAtlas的关键应用方向,包括文献综述、自动化研究趋势综合、思想定位和学术轨迹探索等,以证明SciAtlas可以作为有效的“认知地图”,赋能自动化科学研究的全循环,同时显着降低推理成本。我们已经在 GitHub 存储库中发布了 KG 检索和各种下游任务的接口。