GitHub 热门项目:MambaOut

2026-06-22 1 阅读 GitHub Trending
GitHub 项目:MambaOut 仓库地址:https://github.com/yuweihao/MambaOut 星级:2696 | 作者:于伟豪 项目描述:MambaOut:我们真的需要曼巴来实现愿景吗? (CVPR 2025) =================================================== 自述文件内容: # [MambaOut:我们真的需要 Mamba 来实现视觉吗?](https://arxiv.org/abs/2405.07992) (CVPR 2025)

纪念科比·布莱恩特

> “我能说什么,曼巴出去。” — *科比·布莱恩特,NBA 告别演说,2016 年*
图片来源:https://www.ebay.ca/itm/264973452480

这是我们的论文“[MambaOut:我们真的需要 Mamba 实现视觉吗?](https://arxiv.org/abs/2405.07992)”提出的 MambaOut 的 PyTorch 实现。 ## 更新 * 2024 年 10 月 22 日:非常感谢 Ross [@rwightman](https://github.com/rwightman) 将 MambaOut 集成到 [pytorch-image-models](https://github.com/huggingface/pytorch-image-models) (timm) 并开发 mambaout_rw 模型系列。令人印象深刻的 mambaout_base_plus_rw 模型(102M 参数)仅在 ImageNet-12k 上进行预训练,“*匹配或通过 ImageNet-22k 预训练 ConvNeXt-Large(约 200M 参数)的准确度水平,它与最好的 22k 训练 ViT-Large(DeiT-III,约 300M 参数)相差不远*”。请参阅 Ross 的[文章](https://huggingface.co/blog/rwightman/mambaout) 了解更多详细信息。 * 2024 年 5 月 20 日:根据 [Issue #5](https://github.com/yuweihao/MambaOut/issues/5#issuecomment-2119555019) 的建议,我们发布了带有 **24** 门控 CNN 块的 **MambaOut-Kobe** 模型版本,在 ImageNet 上实现了 **8**0.0% 的准确率。 MambaOut-Kobe 仅在 41% 的参数和 33% 的 FLOP 下,比 ViT-S 的准确率高出 0.2%。请参阅[模型](#models)。 * 2024 年 5 月 18 日:添加关于计算 Transformer FLOP 的[教程](https://github.com/yuweihao/MambaOut/issues/210)(论文中的公式 6)。 --- ![MambaOut 第一图](https://raw.githubusercontent.com/yuweihao/misc/master/MambaOut/mambaout_first_figure.png) 图 1:(a) 门控 CNN 和 Mamba 模块的架构(省略归一化和快捷方式)。 Mamba 模块通过额外的状态空间模型 (SSM) 扩展了门控 CNN。正如第 3 节中将在概念上讨论的那样,SSM 对于 ImageNet 上的图像分类来说不是必需的。为了凭经验验证这一说法,我们堆叠门控 CNN 块来构建一系列名为 MambaOut 的模型。(b) MambaOut 在 ImageNet 图像分类上优于视觉 Mamba 模型,例如 Vision Mamhba、VMamba 和 PlainMamba。
![MambaOut 第二张图](https://raw.githubusercontent.com/yuweihao/misc/master/MambaOut/mambaout_second_figure.png) 图2:机制说明