一张卡,10分钟,这家公司把地球玩成了《我的世界》!

浏览17次 点赞0次 收藏0次

【导读】全球首个3D原生城市世界模型诞生!单图十分钟生成3D城市,高德ABot-Earth0.5只用了百分之一的成本,就让可实时渲染的3D世界,变得触手可及。

人类对物理世界的复刻与重构,从未停止过想象。

从古巴比伦的泥板地图,到大航海时代的羊皮纸海图;从第一张二维卫星影像,到如今手机里司空见惯的导航地图。

人类始终在用更精准、更具象的方式,把庞大复杂的真实世界「装」进小小的载体中。

然而,当我们迈入AI的深水区,传统的方式突然不够用了。

在这个时代,看地图的变成了自动驾驶汽车的传感器、低空物流无人机的「大脑」、具身智能机器人的决策中枢。

它们需要的,是一个拥有物理法则、具备几何深度、高度真实还原的三维世界空间。

很长一段时间里,科技界构建3D城市的方式是「采集拟合」。这种方式昂贵且低效,需要派出无数架无人机,拍摄海量照片,通过庞大的算力集群去计算点云,再靠人工去修补那些「融化」的建筑和树木。

难道这就是唯一的方式吗?

就在刚刚,一个全新技术的诞生,正在改变3D制图的历史走向。

6月8日,高德重磅发布了全球首个3D原生城市世界模型——ABot-Earth0.5。

ABot-Earth0.5的发布不仅宣告着城市级场景3D原生技术的重要突破,更彻底重塑了传统3D建模的生产逻辑与成本结构。


百分之一的成本,千倍的提效

长期以来,提到3D地球,行业的绝对标杆一直是Google Earth。高质量的3D地球建模被视为只有巨头才能承担的「奢侈工程」,传统方案动辄需要数年积累、上百亿投入。

但现在,AI带来效率与成本的底层质变,已进化出另一个维度的形态——ABot-Earth0.5。

支撑这一庞大版图的,是3D生成效率相对传统方式的「降维打击」。

过去,要生成一平方公里的高保真3D城市模型,需要等待晴天派无人机航拍,获取数万张照片,然后再将数据喂给由上百台高性能服务器组成的算力集群,再依靠后期大量修模外包人员进行人工精修。

一套标准的3D城市生成动辄数小时到数天,成本高到只有大型市政项目或巨头企业才能承担。

而ABot-Earth0.5 3D原生的模式从根本上简化了这一流程,击穿了传统模式的成本壁垒。


只需任意模态输入(图像、文本、3D模型),ABot-Earth0.5就能在消费级GPU上10分钟内让一座具备真实地理与几何一致性的3D城市拔地而起,3D城市生成效率提升1000倍。

3D城市的生产周期,正式进入「按分钟交付」的时代。

凭借这种颠覆性的生产力,ABot-Earth0.5目前已经悄然建成了全球覆盖面积最广的3D地图,遍及全球190多个国家和地区。


过去,高保真3D模型是「奢侈品」;现在,ABot-Earth0.5将其变成了「工业标准件」。

告别「中间商」,直达原生渲染

如果仅仅是快和便宜,那可能只是牺牲了质量换来的妥协。

但ABot-Earth0.5生成的3D城市较人工重建的水准也不遑多让。

传统由照片生成的3D模型,其输出格式往往是点云(Point Cloud)或者多边形网格(Mesh),再贴上一层2D的纹理贴图。

这种格式在远看时还可以糊弄眼睛,一旦拉近,建筑边缘的锯齿、植被那惨不忍睹的几何扭曲就会暴露无遗。

更重要的是这些格式在导入到现代游戏引擎或工业仿真软件时,往往需要极为繁琐的格式转换和二次优化。

ABot-Earth0.5的3D原生模式则不再具备这部分忧虑。它的输出,不再是粗糙的网格和贴图,而是原生可渲染、工程可用的3DGS资产。


这种原生格式带来了两个显著优势。

第一,极高的保真度。树叶的缝隙、水波的反射、建筑的复杂纹理,在几千万个高斯基元的描绘下栩栩如生。

第二,高工程可用性。ABot-Earth0.5生成的3D城市,可以直接导入到Unity或Unreal Engine等主流引擎中无缝使用。

没有繁琐的「中间商赚差价」,没有格式转换的数据流失。

ABot-Earth0.5的出现,向全行业宣告:3D城市生成的旧范式,已经被彻底改写。


为什么只有高德做得出来?

看到这里,你一定会疑问:既然3DGS原生世界模型这么强大,为什么之前没有人做出来?为什么偏偏是高德拔得头筹?


要回答这个问题,我们需要进行一次深度的技术拆解。

你会发现,ABot-Earth0.5的诞生并非偶然,它是路径选择、工程能力与数据壁垒共同催生的结果。

高德能够做成这个模型,靠的是二十年积累的真实空间技术和数据,以及对3D原生路线的坚定押注。

打破神话的「真实时空数据」

在当下的人工智能浪潮中,数据是决定模型想象力的天花板。

不同于大语言模型遍布整个以太网的数据量,空间智能模型所需要的真实3D数据量级严重不足。

这也就催生了数据采集工厂和合成数据产业,行业内的一些大模型就是通过游戏引擎生成的虚拟数据进行训练的。

然而,要生成一个真实的「世界模型」,合成数据是完全靠不住的。

因为地球并非是由规则的几何体拼接而成的。真实城市的肌理充满了复杂性:毫无规律生长的庞大植被、高低错落的非标准建筑、在阳光下折射出不同光影的河流湖泊……

如果只用合成数据去喂养AI,AI永远只能学会建造一个并不可靠且「塑料感」十足的乐高城市,因为它无法理解真实世界的地理规律。

而这道横亘在技术发展面前的鸿沟,恰恰是高德的强项——数据护城河。

高德作为扎根物理世界二十余年的科技企业,拥有着其他纯科技公司难以企及的庞大、真实的空间数据储备。

ABot-Earth0.5训练数据源于高德沉淀的海量时空数据,它的每一次训练,都是在吸收真实城市的地理与几何先验。它学习的不是「如何画一栋楼」,而是「真实世界中的楼是如何与街道、树木、光影共存的」,这就从根本上保证了ABot-Earth0.5生成内容的「地理一致性」和「几何一致性」。

这条用时间与脚步丈量出来的数据护城河,是任何后来者都无法在短期内通过砸钱买算力来赶超的。


抛弃「2D蒸馏」,直击「原生3D理解」

在ABot-Earth0.5之前,学术界和工业界探索3D生成,普遍走的是一条「曲线救国」的道路:从2D图像蒸馏3D结构。

简单来说,就是先让大模型看海量的2D照片,然后让它去「猜」这个物体的3D长什么样。

这种方法用来生成一个苹果、一张椅子等物品级的3D模型还勉强凑合;但如果用来生成一座包含万物、结构极其复杂的城市,AI就会瞬间陷入混乱,产出的模型充满了幻觉和几何谬误。

既然要建构3D世界,为什么不直接让AI用3D的方式去思考?

高德所采用的就是一条全新开辟的技术栈——直接以海量3DGS数据训练模型。让AI从一开始就形成对三维空间的原生理解,从而实现在单张卫星图的条件下,端到端直接生成3DGS格式的城市场景。

工程破局:ABot-Earth0.5的四重突破

理论很丰满,但要让原生3DGS模型真正落地为工业级产品,需跨越数据表征、尺度交互、空间连续与条件适配四大工程挑战。

高德通过系统性架构设计,完成了对四大挑战的逐一突破,率先跑通了城市级3D原生场景的端到端生成链路。


挑战一:3D表示差异(Representation Gap)

现有的生成器大多是为处理3D网格(Mesh)设计的。

但真实户外场景里,到处都是树木、水体这类充满「复杂非流形拓扑」的东西,用Mesh表示就像用保鲜膜去包裹一棵树,根本包不住,结果就是一团浆糊。

而3DGS(数百万无序的高斯基元)能完美还原这些细节,但它太庞大、太无序,现有的AI根本咬不动。

为此,高德首创了一个直接在3DGS表示上进行操作的「压缩-生成」框架。

他们就像给极其复杂的3DGS数据做了一个超级ZIP压缩包,将其编码到一个紧凑的隐空间中,让AI能够在其中轻松进行推理和生成,然后再解压成全新的高质量场景。

挑战二:多尺度交互渲染(Scale & Interactivity)

地球级的场景,不能只能远观。用户需要从上帝视角的宏观城市,一秒钟俯冲到微观的街道细节中去。

这种连续的LOD(多层次细节)漫游,是之前的「物品级」生成器连想都不敢想的。为此,高德设计了原生多层次细节(LOD)解码器。它将LOD直接集成到了生成过程中。


不需要生成完再花大把时间去做后处理,AI在生成城市的那一刻,就已经把宏观和微观的层次结构建好了。这为流畅的、实时的在线漫游提供了强大的原生支持。

挑战三:大范围空间连续性(Spatial Coherence)

要生成公里级的大范围场景,AI的显存会被瞬间撑爆。所以必须分块(tiles)生成。但分块生成就像把不同人织的毛衣布料拼在一起,必然会出现刺眼的接缝,完全破坏了真实感。

高德提出了一种高效的「基于滑窗的无缝推理策略」。

AI在生成相邻地块时,会在重叠区域进行智能融合算法处理。就像是一个手法极其高超的裁缝,在针脚交汇处进行了完美的过渡,极大地消除了拼接痕迹,真正实现了公里级甚至更大范围的近乎无缝的连续构建。

挑战四:条件鲁棒性(Conditional Robustness)

全球各地的卫星影像,清晰度不同、颜色不同、拍摄倾角不同,有的甚至还有云层遮挡。

更要命的是,卫星图和AI训练用的航拍图之间存在巨大的「域差异」(比如大气造成的颜色偏差)。

如何让模型在看到任何一张质量参差不齐的真实卫星图时,都能始终稳定发挥?

针对这个问题,高德独创了跨域自适应条件注入策略。

在训练时,高德刻意模拟卫星的视角去渲染航拍重建数据,让模型提前适应这种「模糊感」;在推理时,高德引入了强大的视觉语言模型(VLM)作为一个「适配器」,去动态调整、校准输入的真实卫星影像特性。


这种强大的鲁棒性,确保了ABot-Earth0.5在面对任意一张图时,都能生成高可信度的3D场景。

这四项技术并非孤立优化,而是构成了一套完整的城市级3D原生生成工程体系。

相较于学术界常见的实验性探索,高德首次在工业尺度上打通了从3D数据表征、连续生成到多条件适配的完整链路,验证了前沿3D生成算法走向规模化、低成本落地的工程可行性。

空间智能的工程落地,已经全面开始

当我们惊叹于ABot-Earth0.5的技术亮点时,我们更应该退后一步,看看这项技术发布背后所隐含的巨大产业风暴。空间智能技术的成熟,正在推动多个产业进入新的发展阶段。

补齐AI理解世界的最后一块拼图

在过去的两年里,大语言模型证明了AI在语言理解和逻辑推演上取得了历史性的突破。

但是,文字终究是人类文明的抽象符号。

如果AI要真正融入人类的物理世界,它就必须具备理解空间、生成空间、在空间中行动的能力。这就是目前全球顶级科技圈都在疯狂追逐的圣杯——空间智能。

高德的ABot-Earth0.5则用实打实的工程成果,证明了AI在推断和生成复杂物理空间结构上的惊人突破。


如果说大模型让机器学会了「说话」,那么ABot-Earth0.5就是让机器学会了「睁眼看世界」并「在脑海中构建世界」。这两者的结合,标志着AI的进化正式从二维的数字空间,跨入了三维的物理世界。

场景落地:千行百业的生产力重构

技术突破的最终归宿是产业落地。

ABot-Earth0.5以其惊人的速度、极低的成本和直接沉淀3D模型资产的能力,正在对多个产业带来结构性的颠覆。

具身智能:打通机器人仿真的「任督二脉」

传统的虚拟仿真环境存在致命缺陷:要么因为「太假」导致机器人学不到真实的物理反馈;要么因为追求高保真,导致人工建模成本极其高昂,动辄耗时数月、花费百万,且场景单一,无法覆盖长尾的边缘场景。

ABot-Earth0.5的出现,相当于为具身智能打通了任督二脉。

只需几分钟,ABot-Earth0.5就能根据真实数据生成物理精确的3D城市。真实的台阶高度、路面坑洼的几何起伏、树木与建筑的遮挡关系、甚至光影的反射,都能被精准还原。

并且,它还能生成指数级的训练场景。 只需要输入不同的文本或图像指令,它就能瞬间生成「下雨积水的十字路口」、「满是杂物的狭窄巷道」等无数种复杂的合成数据环境。

这彻底改变了机器人训练的逻辑。

ABot-Earth0.5不再只是一个制图工具,它正在成为具身智能时代不可或缺的底层世界模拟器。

低空经济:以极低成本铺设「天空之城的隐形轨道」

以无人机物流、eVTOL(电动垂直起降飞行器)为代表的低空经济,是当下最火热的万亿级战略赛道。

但想要让成千上万的飞行器在城市上空安全穿梭,依靠传统的2D平面地图无异于盲人摸象。

低空飞行需要精确到厘米级的3D全域地图来规划航线、规避障碍物。

然而,传统的3D测绘成本极高、更新极慢,根本无法覆盖广袤且时刻变化的全域低空。

现在,利用ABot-Earth0.5,低空经济的基建成本被彻底打下来了!

仅需输入常规的卫星图或普通航拍图,ABot-Earth0.5即可在极短时间内、以近乎为零的边际成本,生成覆盖全域的高保真3D基底。

而且,它还解决了一个更为棘手的难题:城市是生长的,昨天没有的塔吊,今天可能就成了致命障碍。凭借「按分钟交付」的极速能力,ABot-Earth0.5能够实现低空地图的高频甚至实时更新。

现在,ABot-Earth0.5为每一架无人机铺设了安全、精准的隐形轨道,让低空空域从不可控的荒野,变成了秩序井然的数字高速公路。

智慧政务与应急响应:与时间赛跑的生命通道

在地震、洪水等灾害发生时,灾区的地貌往往会发生巨大改变。救援的黄金72小时内,每一分钟都极其宝贵。

然而,传统测绘需要漫长的数据处理,等3D模型建好,救援时机早已错失。

而这,正是ABot-Earth0.5发挥极限价值的生死场。

它能实现灾情的实时三维重建。

前方只需用普通无人机飞一圈传回影像,或者仅仅凭借几张现场照片,指挥中心利用单张显卡,10分钟内就能生成灾后现场的1:1三维结构全景。

救援人员可以在这个瞬间生成的3D沙盘上,精准测算泥石流的土方量、寻找安全的直升机降落点、规划不会被二次滑坡波及的生命通道、甚至分析洪水淹没的立体范围。

在常规的城市治理中,这种能力同样带来了质的飞跃。

过去的违建排查、老旧小区改造需要大量人力实地丈量。

现在,通过ABot-Earth0.5快速生成城市高保真3D孪生底座,规划部门可以一键模拟新建高楼对周边小区的日照遮挡。

真正的「数字孪生城市」,因为ABot-Earth0.5的低门槛,实现了普惠应用。

高德,用想象力重塑边界

ABot-Earth0.5的发布,是高德长期技术积累的集中体现。

大众对高德的传统认知,是一个好用的导航软件,是一个地理信息的记录者。

但随着高德首款机器人高德途途和全栈具身技术体系ABot的亮相,高德持续向世界展示了其深厚的技术底蕴。而此次ABot-Earth0.5的发布,正是ABot体系的重要补充和能力放大。

凭借在以ABot技术体系为核心的空间智能算法基础上的持续突破,高德的边界正在无限延伸——它正在从「记录物理世界」的数字制图者,进化为「生成物理世界」的空间智能引擎。

在过去,高德告诉你「世界长什么样」;而在未来,高德的技术将能够为AI和千行百业「按需生成这个世界」。

高德ABot-Earth0.5的发布,已经让空间智能规模化落地成为可能。

一张图,十分钟,一座城。

这在昨天听起来像是科幻小说的情节,在今天已经成为可以用代码运行、用显卡计算的真实工程。

如今,3D城市建模的旧有范式已经被打破,高德作为先行者和定义者,已经推开了那扇通往三维新世界的大门。

官方网站:

abot-earth.amap.com

技术报告:

https://github.com/amap-cvlab/ABot-Earth-0.5/blob/main/tech-report.pdf

声明:本文转载自新智元,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里查看更多信息!本站拥有对此声明的最终解释权。如涉及作品内容、版权和其它问题,请联系我们删除,我方收到通知后第一时间删除内容。

点赞(0) 收藏(0)
0条评论
珍惜第一个评论,它往往能得到较好的回响。
评论
游客
游客
登录后再评论
  • 鸟过留鸣,人过留评。
  • 和谐社区,和谐点评。
最新资讯