迈向高保真与工业化:混元 3D 生成大模型从理论到实践的 SOTA 之路|AICon上海

2026-05-10 1 阅读 AICon 全球人工智能开发与应用大会
当前,以 Agent 为核心的新一轮技术浪潮正在席卷产业。那么,世界模型的下一个突破在哪?Agent 从 Demo 到工程化还差什么?研发体系不重构,还能撑多久? 6月26日-6月27日, AICon全球人工智能开发与应用大会 "将在上海举办。本次大会将围绕以上问题,邀请来自腾讯、阿里、快手、华为、飞猪等50+头部企业的技术负责人、高校与科研机构的一线专家,分享 Agent 在真实生产环境中的落地经验与前瞻思考。深入探讨 Agent 从原型到量产的工程挑战、数据与记忆的基础设施底座、安全可信的落地保障,以及大模型推理优化、智算架构升级等关键命题。 混元资深技术专家杨祥辉已确认出席 “ 人工智能前沿技术探索 "” 专题,并发表题为《 迈向高保真与工业化:混元 3D 生成大模型从理论到实践的 SOTA 之路 "》的主题分享。3D资产是游戏、影视、工业设计等数字内容产业的刚需,但传统3D建模存在门槛高、周期长(单模型平均7天)、成本昂贵(百元至万元)的核心痛点。腾讯混元3D生成大模型致力于通过AIGC技术重塑3D内容生产管线。本次演讲杨祥辉将深度解析如何通过三大核心技术突破实现SOTA效果。 杨祥辉,目前任职于腾讯 TEG,专注于 3D 生成大模型的研发与落地。作为腾讯混元 3D 生成大模型的核心研发成员,深度参与了从混元 3D 1.0 到 3.0 的全系列模型迭代,主导了包括几何基模、纹理基模等多个关键模块的技术演进与工程化实现。在研发中,攻克了高分辨率 3D 表征、高效 3D 稀疏 VAE 解码、PBR 材质生成、美术级智能拓扑等多个技术挑战,推动模型效果达到业界 SOTA。相关成果已成功落地于多个腾讯内部业务,并通过开源(GitHub Star >2.8 万,HuggingFace 下载量超 300 万)及开放平台赋能超过 150 家行业标杆客户,显著降低了 3D 内容创作门槛。研究方向覆盖 3D 生成、多模态理解与生成、AI for Content Creation。他在本次会议的详细演讲内容如下: 演讲提纲:引言:3D AIGC 的机遇与工业级挑战3D内容的稀缺性与生产瓶颈数据分析从“能生成”到“好用、可用、可落地”的鸿沟:精度、可控性、美术规范2. 核心突破一:超高清 3D 几何生成的架构演进数据瓶颈:如何构建支持超高分辨率的3D数据管线?表征瓶颈:高效稀疏3D-VAE解码器的设计,如何将解码效率提升、最大Token 数提升?生成瓶颈:3D-DiT模型的设计理念与实现,如何解决整体结构、表面规整与局部细节的优化冲突?3. 核心突破二:面向真实渲染的材质生成从 RGB 贴图到PBR材质:为何这是逼真渲染的必由之路?业界首个多视图PBR生成框架详解:如何端到端建模法线、粗糙度、金属度等多通道?4. 核心突破三:达到游戏美术标准的生成与后处理智能拓扑:自研Mesh表征BPT如何将表征Token压缩74%,支持2万+面数建模组件化生成:业界首个原生3D分割模型(P3-SAM)与多组件Diffusion架构,如何实现高精度自动拆件?5. 踩坑与反思:高精度数据获取、算法效率与质量的权衡、与专业工具的兼容性等实践挑战听众收益:获得一套完整的工业级3D AIGC技术体系认知:听众将深入了解一个顶级3D生成大模型(混元3D)从技术选型、核心模块创新(几何、纹理、拓扑)到大规模业务落地的全链路设计思路与踩坑经验掌握3D生成领域的关键技术突破与前沿方向:深入理解超高分辨率3D表征、PBR材质生成、符合美术规范的Mesh生成等核心挑战的解决方案,把握从“可用”到“好用”的技术发展趋势,提升在多媒体、游戏、机器人仿真等领域的技术视野与判断力借鉴头部企业的开源与生态建设策略:了解腾讯混元3D如何通过持续开源构建开发者社区、扩大行业影响力的实践,以及如何通过技术开放平台赋能游戏、3D打印、设计等跨行业客户,为技术产品的商业化与生态化运营提供思路 除此之外,本次大会还策划了 端侧 AI、物理与数字空间智能化 "、 世界模型与多模态智能突破 "、 Agent 架构与工程化实践 "、 Agent 安全与可信治理 "、 企业级研发体系重构 "、 AI 原生数据工程 "、 AI 时代的个人提效与组织变革 "等14个专题论坛,届时将有来自不同行业、不同领域、不同企业的50+资深专家在现场带来前沿技术洞察和一线实践经验。 更多详情可扫码或联系票务经理 13269078023 进行咨询。