智能AI 2026-06-08 None MacArena:在在线 macOS 环境上对计算机使用代理进行基准测试 来源: Victor Muryn, Maksym Shamrai, Sofiia Mazepa, Yehor Khodysko
智能AI 2026-06-08 None FAIR-Calib:用于扩散大语言模型训练后量化的前沿感知不稳定性重新加权校准 来源: Haoyu Huang, Linlin Yang, Sheng Xu, Boyu Liu, Guodong Guo, Zhongqian Fu, Hang Zhou, Baochang Zhang
智能AI 2026-06-08 None 使用太赫兹双梳光谱进行聚合物分类的多尺度特征注意网络 来源: Roshni Mahtani, Il\'an Carretero, Laura Monroy, Aldo Moreno-Oyervides, Oscar El\'ias Bonilla-Manrique, Roc\'io del Amor
智能AI 2026-06-08 None Elmes*:长尾教育场景中大型语言模型细粒度评估标准的自动构建 来源: Tao Liu, Ye Lu, Ruohua Zhang, Siyu Song, Wentao Liu, Aimin Zhou, Hao Hao
智能AI 2026-06-08 None 立场:不要只是“事后修复”:人工智能科学必须研究训练动态 来源: Stella Biderman, Mohammad Aflah Khan, Niloofar Mireshghallah, Catherine Arnett, Fazl Barez, Naomi Saphra
智能AI 2026-06-08 None CrowdMath:众包数学研究讨论的数据集 来源: Sherin Muckatira, Jesse Geneson, Slava Gerovitch, Pavel Etingof, Mikhail Gronas, Anna Rumshisky