芯片下沉,AI硬件全面开花

2026-05-20 1 阅读 半导体产业纵横
文 | 半导体产业纵横 2026年的AI硬件市场,正在书写一个属于“落地”的故事。 5月11日,字节跳动将2026年AI资本开支计划从1600亿元上调至逾2000亿元人民币,增幅超过25%,其中更大比例的资金将投向国产AI芯片。与此同时,洛图科技预测,2026年中国消费级AI硬件(不含手机和汽车)市场规模将突破1.27万亿元,到2030年达到2.56万亿元。 如果把这些数字看作AI硬件产业的“水面以上”,那么芯片就是托起这一切的“水面以下”。端侧AI芯片是全球半导体行业增长最迅猛的板块之一,AI眼镜、AI耳机、AI玩具等新兴硬件品类对端侧芯片有着强劲需求。 可以说,没有这些芯片厂商的技术突破和成本下探,就没有AI硬件的万亿叙事。 从云端下沉到终端爆发 AI硬件为什么在2026年集中爆发?答案藏在一个关键词里:端侧算力的临界点。 高通技术公司执行副总裁卡图赞曾指出,云端AI的瓶颈正在日益凸显:延迟、隐私与情境缺失,使得传统“请求-响应”模式难以融入日常生活的细节 。他说:“强大的端侧AI需要与云端AI相结合——当需要即时响应、高度隐私和情境感知的任务,如唤醒词检测、实时翻译、健康监测,在设备端完成;而需要海量知识图谱或超大规模模型参与的复杂推理,则交由云端处理。” 这一判断的实践落地,在2026年的芯片端得到了全面回应。高通在3月发布了骁龙可穿戴平台至尊版——全球首款可跨WearOS、Android和Linux系统运行的个人AI可穿戴平台,也是高通首次将“至尊版”品牌引入可穿戴领域。该平台采用3nm制程工艺,搭载专用Hexagon NPU与低功耗eNPU双核AI加速架构,支持在端侧直接运行多达20亿参数的模型,首个token生成时间压缩至0.2秒,最高可达每秒10个token的推理速度。在此之前,可穿戴芯片只有嵌入式NPU,能处理关键词侦测、动作识别这类“始终开启”任务;骁龙可穿戴平台至尊版则通过引入专用NPU,将端侧AI的天花板大幅抬升。 与此同时,芯片层面的架构创新正在加速。炬芯科技推出的端侧AI音频芯片ATS362X,采用CPU+DSP+NPU三核异构架构,基于存内计算技术实现的NPU理论算力达132 GOPS@500MHz,原生能效比达到6.4 TOPS/W@INT8,经稀疏模型优化后可进一步提升至19.2TOPS/W@INT8。这意味着在保障端侧高强度实时运算的同时,功耗被控制在行业领先水平,完美适配电池供电设备的长效续航需求。目前多个国际知名品牌的2026年新款AI音箱均采用了ATS362X系列芯片。 瑞芯微则推出了端侧算力协处理器RK182X,具备自研高神经网络算力,能够高效支持3B、7B等端侧主流参数的文本型LLM和多模态VLM模型部署;下一代产品RK1860的算力将大幅超过40TOPS,支持13B参数级模型部署;下一代旗舰芯片RK3688正在推进前端设计。近日还最新推出了面向中阶AIoT市场的RK3572,采用8nm先进制程,集成双核Cortex-A73大核与六核Cortex-A53小核,内置4TOPS NPU,相比上一代中阶平台,性能提升超过100%,典型场景功耗降低50%以上。 更值得关注的是行业风向的根本性转变。 根据IDC最新发布的《2026年Q1全球端侧AI芯片市场报告》,全球端侧AI芯片出货量同比增长78%,但旗舰级芯片的算力增速放缓至22%,反而面向IoT、边缘终端、行业场景的中低端AI芯片出货量同比涨幅突破110%。 东吴证券研报进一步指出:端侧模型的演进方向聚焦于多模态零延迟交互和算法侧压缩两个核心维度——前者决定了用户体验的自然度,后者决定了产品功耗和成本的可行性。当这两条路线同时在芯片层面得到实现,AI硬件的临界点才真正到来。 从“听见”到“听懂”的算力下沉 在所有AI硬件品类中,以语音为核心交互方式的产品正在悄然领跑,而驱动这一领跑的核心力量,正是芯片层面的计算从云端下沉到了终端。 据The Business Research Company数据,预计2026年全球AI耳机市场规模达74.2亿美元,2030年将达173.4亿美元。增长的核心驱动力,正在从“内置大模型”的技术标签,转向真实可感的场景价值。真正点燃这个赛道的,是OpenAI首款硬件——代号“Sweetpea”的AI耳机,由苹果前首席设计官Jony Ive操刀,首年预估出货量高达4000万至5000万部,直接对标苹果AirPods系列。这款设备采用2nm制程的智能手机级芯片,大部分AI推理可在本地完成,不再依赖云端。这释放了一个清晰的信号:AI耳机正在成为一个独立的全新智能终端品类。 科大讯飞在这一赛道的表现同样抢眼——其AI会议耳机Pro3搭载的viaim大脑,不仅能自动生成会议标题、要点概览和待办清单,还能根据金融、法律等行业特性定制个性化摘要。在降噪与拾音层面,“气导+骨导”双拾音体系已成为专业场景的主流方案——骨传导传感器通过采集佩戴者头骨的振动锁定人声,从源头上过滤背景噪音,再结合预存的个人声纹特征,这一切的实时性要求都依赖于端侧芯片的强劲算力和低延迟架构。 芯片厂商对音频赛道的投入,佐证了这个品类的战略价值。恒玄科技专注于低功耗无线计算SoC芯片的设计研发,BES2700定位为超低功耗高性能智能可穿戴SoC,已应用于小米AI眼镜等项目;新一代智能可穿戴芯片BES2800在客户TWS耳机、智能手表等终端产品中得到广泛应用;预计今年上半年送样BES6000系列芯片,采用单芯片A+M核异构架构,侧重于多模态交互体验的提升。 再看录音设备。以Plaud为代表的AI录音硬件年营收达2.5亿美元,连续两年实现10倍增长,全球销量已突破百万台规模。一款定价899元的AI录音豆,将“听一小时、整理两小时”压缩为“会后十分钟出纪要”。录音设备的AI化,本质上依赖的是端侧语音识别和自然语言处理能力的下沉。早期的录音笔只能做线性录音,AI化之后,设备需要实时进行语音活动检测、说话人分离、关键信息抽取,这些任务的算力需求虽然低于视觉模型,但对于功耗极其敏感的电池供电设备而言,芯片的能效比仍然是决定性的约束条件。这正是炬芯科技的ATS362X、恒玄科技的BES系列芯片等低功耗AI音频SoC的市场价值所在。从工具角度看,录音芯片与AI耳机芯片均属于超低功耗AI语音芯片赛道,2025年该赛道全球市场规模约为16.86亿美元,预计2032年将达到47.66亿美元。恒玄科技、炬芯科技等国产厂商正在这一领域占据越来越重要的位置。 AI眼镜从“概念验证”到“芯片驱动” 如果说语音硬件是2026年最确定的增长极,那么AI眼镜则是最能体现“芯片驱动”命题的赛道。 IDC预测,2026年中国智能眼镜市场出货量将达451万台,同比增长78%,全球出货量突破2300万台。 受惠于Meta与中系品牌积极拓展海外市场,2026年全球AI眼镜出货量预估较2025年翻倍成长,上看1700万副。这些增长的背后,是芯片供应链在过去18个月里实现的跨越式进步。 高通的骁龙可穿戴平台至尊版是其中最核心的驱动力量之一。该平台通过三级分流处理模式,将计算任务分配给最合适的节点:本地直接运行20亿参数模型用于调整设置、快速回答等轻负载任务;较复