开发者生态
morning
感知图像编解码器:实际学习的图像压缩中重要的是什么
2026-05-24
1 阅读
ksec
关于我们介绍 PICO(感知图像编解码器)——第一个既实用又直接针对人类视觉系统进行优化的学习编解码器。为了推导出它,我们对实际学习的编解码器的建模选择进行了全面的研究,并搜索了数百万个模型配置,以共同优化感知质量和设备上的运行时间。基于大规模主观用户研究,PICO 与 AV1、AV2、VVC、ECM 和 JPEG-AI 相比可节省 2.3-3 倍的比特率,与最先进的编解码器替代方案相比可节省 20-40% 的比特率。与此同时,在 iPhone 17 Pro Max 上,它对 12MP 图像的编码速度可达 230 毫秒,解码速度为 150 毫秒——比在 V100 GPU 上运行的大多数基于 ML 的顶级编解码器还要快。与大多数学习的编解码器不同,PICO还具有跨平台的鲁棒性保证。 PICO(我们的)不同图像之间的交互式比较。 PICO(我们的)固定在左侧。从叠加按钮中选择图像和比较方法,然后拖动滑块进行比较。在大屏幕上观看效果最佳。根据不同的实用性考虑,对最先进的传统编解码器和学习编解码器进行比较。 Comparisons of state-of-the-art traditional and learned codecs.感知 BD 率基于大规模主观研究的人类评分。 iPhone 17 Pro Max 上的速度基准使用相同的编译器优化。引文如果您发现我们的工作有用,请引用:@article{tatwawadi2026pico,title={实用学习图像压缩中的重要内容},作者={Tatwawadi, Kedar and Rahimzadeh, Parisa and Sun, 张浩和陈,Zhiqi and Yang, Ziyun and Nair, Sanjay and Hasteer, Divija and Rippel, Oren},journal={arXiv preprint arXiv:2605.05148},年份={2026} }