开源推荐
morning
GitHub 热门项目:LIMO
2026-06-16
1 阅读
GitHub Trending
GitHub 项目:LIMO
仓库地址:https://github.com/GAIR-NLP/LIMO
星级:1077 | 作者:GAIR-NLP
项目描述:[COLM 2025] LIMO:推理中少即是多
===================================================
自述文件内容:
# LIMO:推理的少即是多🚀
## 更新
- [2025/07/30] 🎉 **新!** 我们发布了 LIMO-v2!这包括更新的论文、新的数据集 (LIMO-v2) 和改进的模型。查看下面的新资源!
- [2025/07/08] 🎉 LIMO已被COLM 2025接受!
- [2025/02/18] 🚨 我们在最近完成的 [AIME 2025 评估](https://github.com/GAIR-NLP/AIME-Preview) 中添加了 LIMO 的性能,它取得了 44.6 的高分,与在更大数据集(800k 样本)上训练的其他模型相比,仅使用 817 个训练样本就展现了具有竞争力的性能。
- [2025/02/10] 🚨 【第三方评测】(https://x.com/WenhuChen/status/1888691381054435690)凸显LIMO强大的泛化能力
- [2025/02/08] 🚨 LIMO 数据集得到了[社区](https://x.stefan_fee/status/1888203185937907993)的积极认可。根据第三方评估,该数据集在 AIME24 和 GPQA 基准上实现了 10 个百分点的性能提升,在 MATH-500 上实现了 3 个百分点的性能提升。这些实验结果证明了 LIMO 在增强 RL 缩放方面的潜力。
## 📌 目录
- [LIMO:推理的少即是多 🚀](#limo-less-is-more-for-reasoning-)
- [更新](#更新)
- [📌目录](#-table-of-contents)
- [概述](#概述)
- [模型动物园](#model-zoo)
- [数据集](#datasets)
- [快速启动](#quick-start)
- [训练](#training)
- [训练设置](#training-setup)
- [启动培训](#launch-training)
- [评价](#evaluation)
- [旧资源 (v1)](#legacy-resources-v1)
- [许可证](#license)
- [引文](#引文)
## 概述
LIMO 通过证明模型可以使用更少但质量更高的训练数据来实现卓越的性能,从而挑战了数学推理中的传统智慧。我们的方法:
- 🎯 通过精心策划的训练样本实现 SOTA
- 🌟 在不同的问题类型中表现出很强的泛化能力
- 🔬提供全面的评估工具
- 📚 发布高质量的数据集和模型
## 模型动物园
我们的 LIMO 模型可在 Hugging Face 🤗 上找到:
|型号|骨干|尺寸|链接 |
|--------|----------|------|--------|
| **LIMO-v2**(最新)| [Qwen2.5-32B-Instruct](https://huggingface.co/Qwen/Qwen2.5-32B-Instruct) | 32B | 32B [🤗](https://huggingface.co/GAIR/LIMO-v2) |
| LIMO-v1 | [Qwen2.5-32B-Instruct](https://huggingface.co/Qwen/Qwen2.5-32B-Instruct) | 32B | 32B [🤗](https://huggingface.co/GAIR/LIMO) |
## 数据集
我们通过 Hugging Face 🤗 发布我们的数据集:
|数据集 |描述 |链接 |
|-----
## 更新
- [2025/07/30] 🎉 **新!** 我们发布了 LIMO-v2!这包括更新的论文、新的数据集 (LIMO-v2) 和改进的模型。查看下面的新资源!
- [2025/07/08] 🎉 LIMO已被COLM 2025接受!
- [2025/02/18] 🚨 我们在最近完成的 [AIME 2025 评估](https://github.com/GAIR-NLP/AIME-Preview) 中添加了 LIMO 的性能,它取得了 44.6 的高分,与在更大数据集(800k 样本)上训练的其他模型相比,仅使用 817 个训练样本就展现了具有竞争力的性能。
- [2025/02/10] 🚨 【第三方评测】(https://x.com/WenhuChen/status/1888691381054435690)凸显LIMO强大的泛化能力
- [2025/02/08] 🚨 LIMO 数据集得到了[社区](https://x.stefan_fee/status/1888203185937907993)的积极认可。根据第三方评估,该数据集在 AIME24 和 GPQA 基准上实现了 10 个百分点的性能提升,在 MATH-500 上实现了 3 个百分点的性能提升。这些实验结果证明了 LIMO 在增强 RL 缩放方面的潜力。
## 📌 目录
- [LIMO:推理的少即是多 🚀](#limo-less-is-more-for-reasoning-)
- [更新](#更新)
- [📌目录](#-table-of-contents)
- [概述](#概述)
- [模型动物园](#model-zoo)
- [数据集](#datasets)
- [快速启动](#quick-start)
- [训练](#training)
- [训练设置](#training-setup)
- [启动培训](#launch-training)
- [评价](#evaluation)
- [旧资源 (v1)](#legacy-resources-v1)
- [许可证](#license)
- [引文](#引文)
## 概述
LIMO 通过证明模型可以使用更少但质量更高的训练数据来实现卓越的性能,从而挑战了数学推理中的传统智慧。我们的方法:
- 🎯 通过精心策划的训练样本实现 SOTA
- 🌟 在不同的问题类型中表现出很强的泛化能力
- 🔬提供全面的评估工具
- 📚 发布高质量的数据集和模型
## 模型动物园
我们的 LIMO 模型可在 Hugging Face 🤗 上找到:
|型号|骨干|尺寸|链接 |
|--------|----------|------|--------|
| **LIMO-v2**(最新)| [Qwen2.5-32B-Instruct](https://huggingface.co/Qwen/Qwen2.5-32B-Instruct) | 32B | 32B [🤗](https://huggingface.co/GAIR/LIMO-v2) |
| LIMO-v1 | [Qwen2.5-32B-Instruct](https://huggingface.co/Qwen/Qwen2.5-32B-Instruct) | 32B | 32B [🤗](https://huggingface.co/GAIR/LIMO) |
## 数据集
我们通过 Hugging Face 🤗 发布我们的数据集:
|数据集 |描述 |链接 |
|-----