首页 / 今日AI / 正文
8 块 GPU 实现影视级 3D 生成,Direct3D-S2 开源登顶 HuggingFace

Time:2025年06月10日 Read:35 评论:0 作者:zhen

近日,由 DreamTech 推出的 Direct3D-S2 3D 大模型在全球 AI 领域引发轰动。该模型成功登顶 HuggingFace 的 3D modeling 应用趋势榜,并在涵盖文本、图像和视频的综合榜单上跃居第 4 位。HuggingFace 作为全球最大的开源大模型社区,其趋势榜极具权威性,此前 DeepSeek、Qwen 等大模型也曾因登顶该榜单而备受瞩目。

8 块 GPU 实现影视级 3D 生成,Direct3D-S2 开源登顶 HuggingFace.jpg

Direct3D-S2 仅需 8 张 GPU 进行训练,却能实现远超数百张 GPU 训练的闭源商用模型的生成效果。其训练效率提升近 20 倍,token 吞吐量从 4K 提升到 256K,提高了 64 倍,致力于实现影视级别高精细度 3D 模型生成,被众多开发者誉为 “最强开源 3D 大模型”。


当下,AI 在 3D 建模领域发展迅猛,微软、Meta、腾讯等行业巨头纷纷布局。但高分辨率 3D 生成一直面临挑战,一方面 3D 数据复杂度远高于 2D,分辨率提升时 token 数量呈立方倍增长;另一方面,主流 AI 架构 Transformer 处理大量细节时计算压力巨大,算力需求指数上升。例如,256 级分辨率的 3D 生成任务通常需 32 至 64 块高端 GPU 训练,而影视级超高精细度任务则需数千甚至上万块 GPU 。


为突破这些瓶颈,DreamTech 联合南京大学、牛津大学提出 Direct3D-S2。该模型创新地提出空间稀疏注意力机制(SSA),可支持超大规模体素生成,面对 1024³ 的超高分辨率,能轻松处理数十万级 tokens,同时基于空间几何连续性概率分布对 tokens 智能分块,保留几何一致性。此外,Direct3D-S2 引入适配 SSA 的全新架构,如稀疏 SDF VAE 和稀疏 DiT,实现全流程效率提升,支持基于 3D 几何空间的 multi-scale 训练与推理,仅用 8 块 A100 GPU,2 天即可完成训练。


在生成质量上,Direct3D-S2 全面超越当前主流开源 3D 生成模型,在数值评测和盲测评估中均表现优异,其细节丰富程度、几何精度等方面优势显著。


值得一提的是,DreamTech 秉持 “技术共享” 理念,已将 Direct3D-S2 全面开源,并采用宽松的 MIT License 协议,允许自由用于商业用途,赢得行业广泛赞誉 。

来【龙头AI网】了解最新AI资讯!

标签:

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

排行榜
龙头AI
欢迎您来到龙头AI是一家AI音乐网,主要提供AI歌词,AI写歌,Ai工具,Ai获客,是Ai时代最有潜力的Ai综合网站!
龙头AI
龙头AI
龙头AI
龙头AI
龙头AI
龙头AI
龙头AI
欢迎您来到龙头AI是一家AI音乐网,主要提供AI歌词,AI写歌,Ai工具,Ai获客,是Ai时代最有潜力的Ai综合网站!