--- source_url: "https://mp.weixin.qq.com/s/N0KGmouW9KBeWTAQzYcPKA" ingested: 2026-06-26 sha256: 2c34ae0fd2f09f7e --- sha256: 3385a93ba13d101b --- title: "高德 ABot-Earth 0.5:全球首个 3D 原生城市世界模型(10 分钟 + 消费级 GPU + 1% 成本)" type: raw-article source_type: wechat-mp source: https://mp.weixin.qq.com/s/N0KGmouW9KBeWTAQzYcPKA author: ASI 启示录 / 新智元 publisher: 新智元 ingested: 2026-06-10 created: 2026-06-10 confidence: 8 value: 8 stars: 4 tags: [world-model, 3d-generation, 3dgs, gaussian-splatting, abot-earth, amap, alibaba, embodied-ai, low-altitude-economy, digital-twin, urban-3d, spatial-intelligence, lod, mesh-vs-3dgs, vlm-adapter, seamless-inference, conditional-robustness] description: 高德发布全球首个 3D 原生城市世界模型 ABot-Earth 0.5:单图/文本/3D 输入,消费级 GPU 10 分钟生成完整 3DGS 城市,成本为传统方案 1%、提效 1000 倍,覆盖全球 190+ 国家。具身智能仿真 + 低空经济 + 应急响应三大落地场景 sha256: c22e9709b6e18eb8f85224036b1273366fcc2e4ebf500e862173ca9b87d96e2f --- # 高德 ABot-Earth 0.5:全球首个 3D 原生城市世界模型 > 来源:新智元(ASI 启示录转载),2026-06-08 > 官网:abot-earth.amap.com > 技术报告:https://github.com/amap-cvlab/ABot-Earth-0.5/blob/main/tech-report.pdf ## 核心定位 高德发布**全球首个 3D 原生城市世界模型** —— ABot-Earth 0.5。任意模态输入(图像/文本/3D 模型)→ 消费级 GPU **10 分钟**生成具备真实地理与几何一致性的 3D 城市。**成本为传统方案 1%,提效 1000 倍**。 已建成全球覆盖面积最广的 3D 地图,覆盖 190+ 国家/地区。 ## 传统范式 vs ABot-Earth 0.5 **传统"采集拟合"模式**: - 派无人机航拍,获取数万张照片 - 上百台高性能服务器算力集群 - 后期大量修模外包人员人工精修 - 数小时到数天;仅大型市政/巨头可承担 **3D 原生模式(ABot-Earth 0.5)**: - 单图/文本/3D 输入即可 - 消费级 GPU 即可 - 10 分钟出结果 - 直接输出原生 3DGS 资产(不是点云/Mesh/贴图) ## 为什么只有高德做得出来? **20 年真实空间数据护城河**:空间智能模型所需的真实 3D 数据严重不足,合成数据(游戏引擎生成的虚拟数据)只能造出"塑料感乐高城市"。高德作为扎根物理世界 20 余年的企业,沉淀了其他纯科技公司难以企及的庞大真实空间数据。 训练不是学"如何画一栋楼",而是学"真实世界中楼如何与街道、树木、光影共存" —— 根本保证**地理一致性**和**几何一致性**。 ## 工程四重突破 **挑战一:3D 表示差异(Representation Gap)** - 现有生成器大多为 Mesh 设计,但户外场景(树木/水体)充满"复杂非流形拓扑",用 Mesh 像用保鲜膜包树 - 3DGS(数百万无序高斯基元)能完美还原细节,但太庞大、太无序,AI 咬不动 - **高德首创 3DGS 压缩-生成框架**:将 3DGS 编码到紧凑隐空间,AI 在其中推理生成,再解压成高质量场景 **挑战二:多尺度交互渲染(Scale & Interactivity)** - 地球级场景需要从上帝视角宏观城市 → 1 秒俯冲到微观街道细节的连续 LOD 漫游 - **高德设计原生多层次细节(LOD)解码器**:将 LOD 直接集成到生成过程,无需后处理 **挑战三:大范围空间连续性(Spatial Coherence)** - 公里级场景会撑爆显存 → 必须分块(tiles)生成 → 必然出现接缝 - **高德提出"基于滑窗的无缝推理策略"**:相邻地块在重叠区域智能融合算法处理,像手法高超的裁缝在针脚交汇处完美过渡 **挑战四:条件鲁棒性(Conditional Robustness)** - 全球卫星影像质量参差不齐(清晰度/颜色/倾角/云层) - 卫星图与航拍图存在"域差异"(大气颜色偏差) - **高德独创跨域自适应条件注入策略**: - 训练时:刻意模拟卫星视角渲染航拍重建数据,让模型提前适应"模糊感" - 推理时:引入**视觉语言模型(VLM)作为适配器**,动态调整/校准输入的真实卫星影像特性 ## 三大产业落地场景 **1. 具身智能:打通机器人仿真任督二脉** - 传统虚拟仿真:要么"太假"学不到真实物理反馈,要么高保真成本极高(数月/百万/场景单一) - ABot-Earth 0.5:几分钟生成物理精确 3D 城市,真实台阶高度/路面坑洼/树木遮挡/光影反射精准还原 - 指数级训练场景:输入不同文本/图像,瞬间生成"下雨积水的十字路口"、"满是杂物的狭窄巷道"等无数复杂合成数据 - 不再只是制图工具,是具身智能时代**不可或缺的底层世界模拟器** **2. 低空经济:天空之城的隐形轨道** - 无人机物流/eVTOL 万亿级战略赛道需要厘米级 3D 全域地图 - 传统 3D 测绘成本极高、更新极慢 - ABot-Earth 0.5:常规卫星图/普通航拍输入 + 极短时间 + 近零边际成本 = 全域高保真 3D 基底 - 解决"城市是生长的"难题:昨天没有的塔吊今天就是致命障碍 → 高频/实时更新 **3. 智慧政务 + 应急响应:与时间赛跑** - 地震/洪水 黄金 72 小时:传统测绘漫长处理早已错失救援时机 - ABot-Earth 0.5:普通无人机飞一圈传回影像 → 指挥中心用单张显卡 → 10 分钟生成 1:1 三维全景 - 精准测算泥石流土方量/寻找安全直升机降落点/规划不被二次滑坡波及的生命通道 - 违建排查/老旧小区改造:一键模拟新建高楼对周边小区的日照遮挡 ## 战略意义 **从"记录物理世界"到"生成物理世界"**: - 过去:高德告诉你"世界长什么样" - 未来:高德为 AI 和千行百业"按需生成这个世界" **AI 进化的关键跃迁**: - 大模型让机器学会"说话" - ABot-Earth 0.5 让机器学会"睁眼看世界"并在"脑海中构建世界" - AI 进化正式从二维数字空间跨入三维物理世界 ## 技术栈速查 | 维度 | 传统方案 | ABot-Earth 0.5 | |------|----------|----------------| | 输入 | 无人机航拍数万张 | 单图/文本/3D 模型 | | 算力 | 上百台高性能服务器 | 消费级 GPU(单卡)| | 时间 | 数小时到数天 | 10 分钟 | | 成本 | 数百万 | 1% | | 输出格式 | 点云/Mesh + 贴图 | **原生 3DGS** | | 引擎兼容 | 需格式转换 | 直接导入 Unity/Unreal | | 覆盖范围 | 局部 | 公里级无缝连续 | | 训练数据 | 合成数据 | 真实时空数据 20+ 年 | ## 关键人物/产品 - **高德 ABot**:全栈具身技术体系(高德途途机器人 + ABot-Earth 0.5) - **首款机器人**:高德途途 - **技术栈**:3DGS 压缩-生成框架 + 原生 LOD 解码器 + 滑窗无缝推理 + VLM 跨域适配