腾讯近期推出了一款支持从文本到 3D 和从图像到 3D 生成的开源大模型 Hunyuan3D-1。该模型通过两阶段生成方法实现,从简单的文本描述或图像生成 3D 对象,初期生成多视角图像,然后进行多视角重建,全流程最快仅需 10 秒。
Hunyuan3D-1 采用自适应 CFG 技术和混合输入处理方法,支持 Signed Distance Function 作为隐式表示,并通过 Marching cube 算法输出 3D 网格,以此来表示复杂结构并确保表面光滑。腾讯提供了轻量版和标准版模型,模型权重和推理代码对开发者开源,以满足不同需求。
该模型在多个领域有应用,包括游戏开发、工业制造、建筑规划、电商零售、教育、文化遗产保护及社交媒体。腾讯已在自身产品中应用这一技术,如腾讯地图和元宝 APP,并通过开放模型和算法细节,为全球开发者提供支持。