腾讯上线“3D 模型 AI 生成”一站式平台:模型师和美术外包要哭了!

点评

图标 近年来,AIGC(人工智能生成内容)在游戏行业内掀起了一股浪潮。从聊天机器人到图像生成、音乐创作,AI 技术在 2D 领域已经取得了惊人的突破,带来了无数令人……

近年来,AIGC(人工智能生成内容)在游戏行业内掀起了一股浪潮。从聊天机器人到图像生成、音乐创作,AI 技术在 2D 领域已经取得了惊人的突破,带来了无数令人惊叹的应用。

然而,当我们试图将这些突破扩展到更复杂的 3D 领域时,挑战却变得异常艰巨。尽管像 Stable Diffusion 这样的 2D 内容生成工具已经在业界引起轰动,但 3D 内容,考虑到其面向的核心群体主要是有商业化需求的企业方,而非普通消费者,相关 AI 技术在生成质量、风格化、自由度等方面,AIGC 仍然面临着技术复杂性和高壁垒。

也正因如此,近几年国内外 AI 大模型公司不少都在试图攻克这一领域,试图夺得先机,就比如腾讯。近日,腾讯便官宣开源上线了混元 3D 生成大模型 2.0(以下简称为「混元 3D 2.0」)以及同步上线混元 3D AI 创作引擎,并打出了“业界首个一站式 3D 内容 AI 创作平台”的口号。

对于混元 3D 2.0,腾讯云官方表示:“一句话、一张图,甚至随手画个草图,都能生成一个生动逼真的 3D 模型,甚至还能加动作、换纹理、捏人物、做动画。”

更好、更快、更强

根据官方信息,混元 3D 2.0 通过改进几何和纹理两大核心生成模块,实现了性能和生成质量的显著提升。

首先,混元 3D 2.0 采用“解耦生成”技术,让几何与纹理模型分工明确又相互配合。几何大模型 Hunyuan3D-DiT 与 Hunyuan ShapeVAE,能捕捉 3D 物体的复杂结构,生成效果堪比设计师手工建模;而纹理大模型 Hunyuan3D-Paint 则通过文字或图片描述,为模型赋予丰富的细节与高清纹理,支持多种风格切换。

用人话说就是 2.0 版本的混元 3D 生成的内容效率、自由度更高,同时几何结构更加精细,纹理色彩更加丰富了。

此外,该平台引入低多边形模型生成能力,可根据物体复杂程度自适应优化输出,既保障细节效果,又为游戏引擎渲染提供了更优性能支持。

这些技术创新显著降低了 3D 内容创作门槛,使得专业开发者和普通创作者都能轻松实现创意落地。以腾讯官方统计数据为例,通过混元 3D 引擎,部分 3D 资产制作时间已从 5-10 天缩短至分钟级,大幅提高了创作效率。

同时,混元 3D AI 创作引擎更是为混元 3D 2.0「画龙点睛」。感兴趣的可以前往该网址体验:https://3d.hunyuan.tencent.com/

该平台从文本或图片生成模型,到草图生 3D、3D 纹理生成,再到角色动画以及可能国内开发者最关心的小游戏制作,功能一应俱全,并且其模块化设计支持快速搭建创作工作流,为团队协作提供了高效解决方案。

各种小功能

可以创建工作流

当然作为业余选手,GameLook 也第一时间体验了混元 3D AI 创作引擎,以下是目前混元 3D 2.0 文本及图片生成 3D 模型功能,GameLook 上手实测后生成的结果。

虽然肉眼可见的模型在面部细节等方面仍有不足之处,且基本不支持超写实等精度要求较高的风格,但结合其超高的效率,无论是文本还是图片生成,其耗时都在两分钟以内,GameLook 对于结果还是相当惊喜的。

文生 3D 的结果

图生 3D 的结果

参考图片 图片来源:豆包 AI

至于小游戏生成功能,GameLook 也进行了尝试,只不过不同于谷歌之前公布的 Genie 2,该工具并非从零开始生成一个新游戏,而是按照既定的模板生成一段新的视频,体验上更像是类似 AI 换脸视频。

当然这可能是因为该项目目前还处于测试阶段,小游戏生成目前有且仅有一种小游戏玩法模板——RPG 玩法的《勇闯空岛》,且用户没有太多的可自定义空间(只能上传头像然后选择角色的风格)。

后续随着腾讯完善、开放相关工具,引入自家微信小游戏平台上海量的开发者,或许所谓的小游戏生成功能也能够迸发出真正的社区潜力。

腾讯才升级,海外有团队已经成功商业化了

从功能上看,混元 3D 2.0 的应用领域 GameLook 认为理论上是广泛的。

就比如游戏项目早期的创意启发和验证方面,混元 3D 2.0 可以快速生成大量 3D 模型、材质并为其快速绑定简单的动作,对于游戏团队而言,这其实可以快速提升早期创作概念原型 d 的效率,为开发团队在前期验证环节节省大量时间和人力成本,从而更专注于游戏玩法的迭代与优化。

Roblox 其实已经有了类似的 AI 工具

又或者是类似《元梦之星》《Roblox》等带有 UGC 要素的游戏产品,该模型也能为普通玩家创建各式各样的 UGC 内容提供便利,可以说是既无代码编程工具之后,对于游戏 UGC 生态最利好的技术进步之一。

不过一直关注 AI 领域的读者可能也清楚,虽然高质量 3D 内容的 AIGC 目前依旧困难,但市面上其实过去几年已经出现了不少相当成熟甚至实现了商业化的工具,甚至各个工具之间也已展现出自己鲜明的特点。

这里 GameLook 就简单介绍三个代表性的产品:

Project Bernini

工业软件领域的老牌大厂 Autodesk,其在去年 5 月就公布了一个名为 Project Bernini 的研究项目,并展示了该项目的初步能力。按照 Autodesk 给出的说法,Project Bernini 是聚焦为设计和制作行业研发生成型 AI 的研究,首次试验模型可以快速通过各种输入生成功能性的 3D 形状,这些输入方式包括 2D 图片、文字、体素(voxels)和点云(point clouds)。

目前,Project Bernini 严格用于实验,且不能被公众使用。不过,Autodesk 表示,团队在打磨这个技术,随后会主动寻求合作伙伴参与其中,以提升该模型的性能。

当然 Autodesk 作为非游戏方向的企业,Project Bernini 其实瞄准的是更广大的工业市场 Autodesk 表示其正努力创造用于建筑、产品设计、娱乐和更多领域的生成型模型,并且聚焦于生成功能型 3D 结构,“因为根据这些模型的输出构建或制作的物品必须在现实世界中行得通,以达到设计者心中的目的。”

GiiNEX

腾讯 GiiNEX 是一款由腾讯 AI Lab 游戏 AI 团队研发的综合性 AI 工具。该模型包含前沿算法模型、 高效训练平台以及在线推理引擎三大核心,支持 MOBA、FPS、派对游戏等十余种游戏类型;同时面向高性能训练平台可支持万卡规模资源调度。其在线推理引擎更是兼容主流设备,实现移动端与云端的混合部署,保障多端协同。

具体到特色上,腾讯 GiiNEX 主要对自己在 2023 年发布的 3D 城市自动生成方案进行工具化升级,提供城市布局、建筑外观和室内映射三大 AI 工具,实现与主流游戏引擎无缝集成。并且效率提升显著,据悉,该引擎构思并创建一个 25 平方公里的城市,从至少 5 天缩短至 25 分钟。

当然利用生成式 AI 技术,腾讯 GiiNEX 也为玩家提供一系列游戏内可用的 UGC 关卡设计工具,甚至这一模型此前已部署到了《元梦之星》中。从设计灵感、模块搭建到配色及关卡设计优化,极大提高了玩家创作效率,轻松将创意转化为个性化游戏关卡。还能让零基础玩家轻松打造 3D 模型,通过上传真人视频将动作“复制”到游戏角色上,并优化体型差异,确保动作自然匹配。

Kaedim

Kaedim 是一家成立于 2020 年的英国初创公司,专注于利用人工智能技术将 2D 图像快速转换为高质量的 3D 模型。用户只需上传 1 到 6 张图像,Kaedim 的 AI 算法即可生成相应的 3D 模型,并支持导出至主流的 3D 格式,如 OBJ 和 FBX。

Kaedim 此前的商业模式基于订阅服务,价格在每月 300 至 4000 美元之间,不算亲民。不过由于该公司除了 AI 生成以外,还提供人工调整 AI 生成的模型这一服务,可能是供不应求,目前该产品已经完全取消了固定价格的订阅服务,所有用户都需要根据自身需求联系其销售团队来获取不同的报价。

“帮助某些游戏项目的上线速度提升了 10 倍”

当然全面转向 2B 市场之后,Kaedim 其实也吸引到了不少大企业,就比如游戏行业比较熟悉的 Paradox 等。同时在官网中 Kaedim 还写道“位居全球前十的某家游戏公司”“位居全球前三的某家手游公司”都是它们的客户。

而近年来,该公司的成功也为其吸引来了多轮融资。根据 Pitchfork 的数据,Kaedim 成立以来,该公司已经进行了 5 轮融资,其中 2024 年 5 月的 A 轮融资,Kaedim 一共筹集了 1500 万美元。

对游戏行业的影响

混元 3D 2.0 等一众 AI 工具的冒头,无疑预兆了游戏行业即将发生的变化,特别是在涉及外包人员等方面。传统上,游戏开发中的 3D 建模和场景设计往往依赖大量的外包人员,而混元 3D 2.0 的高效生成能力理论上是能够显著减少这部分工作量。

虽然仅从游戏本身来看,也有好消息,毕竟效率的增加意味着游戏开发团队内部的角色分工也将发生变化。由于混元 3D 2.0 等 AI 工具能够快速生成大量基础模型,设计师和艺术家或许能更多地参与到创意设计和细节优化中,而不再仅仅是重复性劳动。

但长久来看,这一变化最直接的影响可能就是外包市场的收缩,许多外包公司需要调整业务模式,以应对新技术带来的挑战。

图源:维塔士官网

而对于 AI 由下至上取代一部分行业内的工作,冲击外包市场的可能性,游戏行业长期为海内外大型项目研发、发行提供帮助的维塔士中国区总经理田立,此前曾在 GameLook 的采访中表达过自己对 AI 的态度,他说:“长远来看,AI 一定会对美术外包行业造成冲击。我认为,被 AI 替代的部分早晚会发生,甚至比例比预想的还要高。

“目前还没有客户直接说将 AI 用于最终的游戏生产环节,但 AI 已经应用于一些创意和中间环节,例如设计稿的创作。目前的应用还处于探索阶段,主要用于辅助创意和设计,尚未直接用于最终的游戏内容生产。”

“当然,我们从一开始就以拥抱的态度面对 AI。我们相信,最终决定游戏设计和方向的还是人,AI 不可能完全取代人类。”

不过从现实来看,AI 生成 3D 内容目前依然存在诸多局限性。就比如生成模型的细节质量、风格一致性和精准度仍然是亟待解决的问题,尤其是在商业领域,如果生成的模型不合格,团队可能需要花费更多时间去修复甚至完全重做,这无疑会削弱 AI 工具的价值。

当然还有老生常谈的版权问题。且不说训练数据,仅生成结果,目前在混元 3D AI 创作引擎里,GameLook 就看到了应该是玩家生成的米老鼠的模型。不过目前混元 3D AI 模型才刚刚测试,后续 GameLook 也愿意相信腾讯能做好风险规避。就比如类似当前很多文生图工具,直接在生成结果上进行调整。

豆包 AI 就没办法生成米老鼠的内容

好消息是,这些其实非常致命的局限性也为行业从业人员提供了重要的缓冲时间。至少目前 AI 并非要完全取代人类,更多是帮助人类更高效地完成重复性工作。

转载自:GameLook 侵删