智能AI
morning
GitHub 热门项目:aiXcoder-7B
2026-05-09
1 阅读
GitHub Trending
? GitHub 项目:aiXcoder-7B
?仓库地址:https://github.com/aixcoder-plugin/aiXcoder-7B
⭐ 星星:2277 | ? 作者:aixcoder-plugin
? 项目描述:aiXcoder-7B 代码大语言模型官方存储库
===================================================
? 自述文件内容:
===================================================
# aiXcoder-7B 代码大语言模型
? 官网|? 论文 | ? VS Code 插件|? Jetbrains 插件|? 模型权重|微信|微信公众号
欢迎来到aiXcoder-7B代码大语言模型的官方存储库。该模型旨在跨多种编程语言理解和生成代码,在代码完成、理解、生成以及有关编程语言的更多任务方面提供最先进的性能。 目录 - [aiXcoder-7B 代码大语言模型](#aixcoder-7b-code-large-language-model) - [型号介绍](#model-introduction) - [快速入门](#快速入门) - [环境要求](#environment-requirements) - [选项 1:构建环境](#option-1-build-env) - [选项 2:Docker](#option-2-docker) - [模型权重](#model-weights) - [推理示例](#inference-example) - [命令行执行](#command-line-execution) - [Python 脚本执行](#python-script-execution) - [通过bitsandbytes量化](#quantized-through-bitsandbytes) - [微调示例](#fine-tuning-example) - [aiXcoder 7B 的数据](#data-for-aixcoder-7b) - [训练](#training) - [训练超参数](#training-hyperparameters) - [批处理方法](#batch-processing-method) - [预训练任务](#pre-training-tasks) - [实验结果详情](#details-of-experimental-results) - [NL2Code 基准](#nl2code-benchmarks) - [代码完成(填充中间)](#code-completion-fill-in-the-middle) - [跨文件代码评估](#cross-file-code-evaluation) - [许可证](#license) - [致谢](#致谢) - [引文](#引文) ## 型号介绍 随着大型代码模型的能力逐渐被挖掘,aiXcoder一直在思考如何让这些模型在真实的开发场景中发挥更大的作用。为此,我们开源了aiXcoder 7B Base,它经过了1.2T Unique Tokens的广泛训练,模型的预训练任务以及上下文信息都是针对现实世界的代码生成上下文而独特设计的。 aiXcoder 7B Base 在所有参数大小相似的模型中脱颖而出,成为代码补全场景中最有效的模型,并且在多语言 nl2code 基准测试中的平均性能也超越了 codellama 34B 和 StarCoder2 15B 等主流模型。 在我们正在进行的电子