欧洲杯体育咱们与高继扬会后的对话-开云「中国」kaiyun体育网址-登录入口

发布日期：2026-06-20 09:03 点击次数：111

高继扬有一个判断：具身智能不存在所谓的"GPT 时刻"。

这话听起来有点反共鸣。往时两年，这个行业民风了用"时刻"来绚烂进展。比如某家公司机器东说念主完成了后空翻，某款模子在某个榜单上刷了新记载，众人就会问，这是不是具身智能的 ChatGPT 时刻？

高继扬的恢复是，不会。

具身智能的进展不会麇集爆发，也很难由一次居品发布来界说。它更可能从 B 端运转，在仓储、零卖、工业、奇迹、科研这些场景里少量点浸透进去。某个场景先跑通，某类任务先踏实，然后再徐徐扩展到更多任务。等几年后回头看，才发现机器东说念主仍是进了多量坐蓐步伐。

这个判断决定了星海图在作念什么、不作念什么。

6 月 16 日，星海图在亦庄办了一场全球开发者大会。会上公布了三件事：新一代 VLA 基础模子 G0.5，自研双足东说念主形机器东说念主 Kengo（行客）亮相，以及联接北京亦庄共建的数据公司"亦数智能"负责揭牌，启动"100 万小时超高质地确实数据霸术"。

但这些数字和发布不是这篇著作的重心。

重心是，咱们与高继扬会后的对话。他从"为什么现阶段不追第一"聊到"一块钱数据至少十块钱试验"，再到"整机和供应链是有限游戏，智能和诓骗才是无尽游戏"。

以下为对话内容，略有删减。

智客ZhiKer：VLA 模子与天下模子（WAM）的数据能否通用？

高继扬：这两个阶梯不是对立的，它们的底层其实是相通的，都是把多模态数据酿成 Token，通过多层 Transformer 作念编码和输出，仅仅监督神气和试验神气有所不同。从这个角度来说，扫数的数据都不错互用混用。

咱们汇聚数据执行上是为了铺满四个维度：行为维、对象维、场景维、执行维。不同的汇聚神气（Human Centric 和 Robot Centric）各有各的上风，最终都是为了让这四个维度的数据尽量铺满。Human Centric 数据跨执行才略强、汇聚遵循高、资本低；Robot Centric数据则是模子最终部署到机器东说念主执行上所需要的。

智客ZhiKer：奈何看待"器具身大脑闭幕行业有躯无智"这一说法？具身智能竞争的枢纽是什么？

高继扬：咱们刚创业的时辰提过两个词，一个是“一脑多形”，一个是“在脑不在形”。这话可能说得相比直，莫得大脑驱动，形骸即是破铜烂铁。

这个行业要往前走，一定得先把具身大脑，也即是具身基础模子作念出来，然后身手带动凹凸游。往上推整机和零部件，往下推诓骗和分销。

智客ZhiKer：现阶段为什么不追求王人备第一？什么时辰会运转大领域膨大？

高继扬：这个行业的中枢是 AI 驱动的，在整机销售这个阶段去争第一第二，没太冒昧思意思。说真话，在这个阶段猛冲量，更像是往金钱欠债表上堆欠债，而不是堆金钱。

咱们会按我方的节律走。去年比旧年有 10 倍的增长，本年亦然数倍的增长。等智能着实运转驱动第二阶段的营业模式了，当时辰才是拼第一的时辰。

智客ZhiKer：你说的第二阶段营业模式是什么？

高继扬：咱们把具身智能发展分为三个跃迁阶段，本能智能、功课智能和进化智能。本能智能径直作用于执行，让机器东说念主像东说念主相通自然学会独霸身体，保持均衡、行走、奔走；功课智能修复在本能智能之上，解决像东说念主相通有序功课和操作的问题，话语是它的进军接口，星海图的G系列模子恰是功课智能模子；进化智能则指向更深的问题，AI能弗成界说最优坐蓐力花式。

第二阶段是功课智能，指的是面向坐蓐力场景的有谋划订阅，这个市集领域比前两个阶段大出好几个数目级，基本等于在重写 GDP。

当今扫数这个词行业还在以整机销售为中心，莫得任何一家企业能在坐蓐力场景里着实干活。是以，着实的仗还没运转打。

智客ZhiKer：预试验阶段是否使用仿真数据？数据资本方面的压力奈何样？

高继扬：咱们目下试验全部使用确实数据，基本没用仿真数据。至少在达到 100 万小时数据之前，我看不到使用仿真数据的必要性，确实数据铺满那四个维度的速率更快、遵循也更好。

说到资本，我认为弗成光盯着数据的单向资本，得看智能总资本。它包括三块：数据资本、算力资本、研发资本。咱们在实践里，数据跟算力的比例差未几是 1:10，花一块钱采数据，至少得花十块钱作念试验。数据质地是压根，最高质地的数据即是确实数据。

具体数字的话，Human Centric 省略 50 到 100 块钱一小时，Robot Centric省略 250 块一小时。笼统算下来，100 万小时的数据资本省略在 1 到 2 亿东说念主民币。跟谎话语模子每年几亿好意思金的算力参加比，这笔钱必须花，并且很是合算。

智客ZhiKer：奈何从百万小时冲到千万小时？数据量上去之后，模子才略会有什么变化？

高继扬：咱们依托亦庄智能平台，走外包汇聚加众包汇聚两条路。众包是坐蓐奉陪式的，工东说念主普通干活的时辰带上开导，当然就采了；外包是针对特定任务，特意雇东说念主来采。

数据量上去，主要解决的是泛化问题，到新场景、接新任务，能弗成不加数据就处分。实施速率的栽植，靠的是后试验，跟工东说念主上岗前需要再培训一个意旨。

拿叠穿着例如，三个月前速率还极度慢，迭代到当今仍是快了许多。这个成长速率，致使比婴幼儿学期间还要快。

智客ZhiKer：如若众人都在冲击百万小时数据量，数据的壁垒是什么？

高继扬：99% 的具身智能数据是独罕有据。翌日具身智能模子能作念成什么样，很猛经由上就看数据好不好、对数据的相识深不深。

数据相识的通晓互异会传导到模子才略的互异，再传导到诓骗遵循和营业价值的互异，这是一个完满的链路。

智客ZhiKer：数据能否作念成标品，由第三方公司提供给各家诓骗企业？

高继扬：从表面业务模式上说，是不错的。

比如说海天瑞声，自己即是作念数据标品和奇迹的上市公司。但具身智能有个艰苦：整机、数据、模子试验这三件事耦合太紧了。数据采归来之后，算法的东说念主必须跟数采和运营的东说念主精采迭代，身手把数据质地提上来。

是以咱们作念了两件事：一是投了数采开导企业，二是跟亦庄控股等联接发起公司，把场景、开导、数据管线、模子需求这些东西握到一块，这么才有可能作念出高质地的标品数据集。

智客ZhiKer：数据、模子、整机，哪一块最进军？资源奈何分拨？

高继扬：政策上即是整机加智能，两者不可偏废。开释物理天下的坐蓐力，唯一模子不够，整机也需要蹧跶好的可靠性、一致性和负载才略。但从研发参加来看，智能的研发参加比整机最初一个数目级。

智客ZhiKer：G0.5 模子什么时辰用在 Kingo 双足机器东说念主上？

高继扬：G0.5 的模子架构是为双臂智能/轮式双臂品类准备的，会先诓骗在 R1Light、R1Pro 等居品上。Kingo 主力发展的是本能智能模子。

功课模子（VLA/天下模子）以师法学习为主、强化学习为辅；本能智能反过来，以强化学习为主、师法学习为辅。最终这两样会交融在沿路，可能是某种组合比例。比及本能和功课智能真融在沿路了，G0.5 的才略才会带到 Kingo 上。

智客ZhiKer：Kingo 的要道模组有什么特色？订价和营业化霸术呢？

高继扬：要道模组的话，咱们整机全部用 EC 通讯，同步性是行业里最佳的，但研发难度也最大。为此咱们在流控和中生机象凹凸了不少功夫，电机的电磁仿真、减慢器想象上也作念了许多优化。性能在第一梯队。

资本的话，这类居品的 BOM 最终会踏实在 1 万好意思金傍边，省略两年内能作念到。但资本自己未定定能弗成营业化，枢纽在于大脑颖异什么活。发挥国度劳能源一年省略 4 到 5 万好意思金，如若硬件一万好意思金、一年回本，剩下三四万好意思金即是智能的空间。

整机和供应链是有限游戏，智能和诓骗才是无尽游戏。作念整机是为了拿到背面无尽游戏的入场券。

智客ZhiKer：Kingo 搭载本能智能模子后，翌日的落地场景有哪些？

高继扬：本能模子最低级阶段即是作念强化学习能作念的事，舞蹈、跑跳、行走，对应的是展演展示的营业化。才略再往上走，下一步是全身遥操作，等于有了一个良友化身，不错作念电站巡检之类的轻功课。再往后，本能智能跟功课智能交融起来，就能进制造业、建筑业这些非结构化场景作念重活了。

不外有少量要说了了欧洲杯体育，在深谷这种结构化场景里，轮式双臂其实更有上风，双足反而杂音大、遵循低。（本文首发钛媒体APP，文 | 智客Zhiker，作家｜郭虹妘）

上一篇：开yun体育网一辆车撞了安保摩托车队-开云「中国」kaiyun体育网址-登录入口

下一篇：没有了