欧洲杯体育咱们与高继扬会后的对话-开云「中国」kaiyun体育网址-登录入口
发布日期:2026-06-20 09:03    点击次数:111

欧洲杯体育咱们与高继扬会后的对话-开云「中国」kaiyun体育网址-登录入口

高继扬有一个判断:具身智能不存在所谓的"GPT 时刻"。

这话听起来有点反共鸣。往时两年,这个行业民风了用"时刻"来绚烂进展。比如某家公司机器东说念主完成了后空翻,某款模子在某个榜单上刷了新记载,众人就会问,这是不是具身智能的 ChatGPT 时刻?

高继扬的恢复是,不会。

具身智能的进展不会麇集爆发,也很难由一次居品发布来界说。它更可能从 B 端运转,在仓储、零卖、工业、奇迹、科研这些场景里少量点浸透进去。某个场景先跑通,某类任务先踏实,然后再徐徐扩展到更多任务。等几年后回头看,才发现机器东说念主仍是进了多量坐蓐步伐。

这个判断决定了星海图在作念什么、不作念什么。

6 月 16 日,星海图在亦庄办了一场全球开发者大会。会上公布了三件事:新一代 VLA 基础模子 G0.5,自研双足东说念主形机器东说念主 Kengo(行客)亮相,以及联接北京亦庄共建的数据公司"亦数智能"负责揭牌,启动"100 万小时超高质地确实数据霸术"。

但这些数字和发布不是这篇著作的重心。

重心是,咱们与高继扬会后的对话。他从"为什么现阶段不追第一"聊到"一块钱数据至少十块钱试验",再到"整机和供应链是有限游戏,智能和诓骗才是无尽游戏"。

以下为对话内容,略有删减。

智客ZhiKer:VLA 模子与天下模子(WAM)的数据能否通用?

高继扬:这两个阶梯不是对立的,它们的底层其实是相通的,都是把多模态数据酿成 Token,通过多层 Transformer 作念编码和输出,仅仅监督神气和试验神气有所不同。从这个角度来说,扫数的数据都不错互用混用。

咱们汇聚数据执行上是为了铺满四个维度:行为维、对象维、场景维、执行维。不同的汇聚神气(Human Centric 和 Robot Centric)各有各的上风,最终都是为了让这四个维度的数据尽量铺满。Human Centric 数据跨执行才略强、汇聚遵循高、资本低;Robot Centric数据则是模子最终部署到机器东说念主执行上所需要的。

智客ZhiKer:奈何看待"器具身大脑闭幕行业有躯无智"这一说法?具身智能竞争的枢纽是什么?

高继扬:咱们刚创业的时辰提过两个词,一个是“一脑多形”,一个是“在脑不在形”。这话可能说得相比直,莫得大脑驱动,形骸即是破铜烂铁。

这个行业要往前走,一定得先把具身大脑,也即是具身基础模子作念出来,然后身手带动凹凸游。往上推整机和零部件,往下推诓骗和分销。

智客ZhiKer:现阶段为什么不追求王人备第一?什么时辰会运转大领域膨大?

高继扬:这个行业的中枢是 AI 驱动的,在整机销售这个阶段去争第一第二,没太冒昧思意思。说真话,在这个阶段猛冲量,更像是往金钱欠债表上堆欠债,而不是堆金钱。

咱们会按我方的节律走。去年比旧年有 10 倍的增长,本年亦然数倍的增长。等智能着实运转驱动第二阶段的营业模式了,当时辰才是拼第一的时辰。

智客ZhiKer:你说的第二阶段营业模式是什么?

高继扬:咱们把具身智能发展分为三个跃迁阶段,本能智能、功课智能和进化智能。本能智能径直作用于执行,让机器东说念主像东说念主相通自然学会独霸身体,保持均衡、行走、奔走;功课智能修复在本能智能之上,解决像东说念主相通有序功课和操作的问题,话语是它的进军接口,星海图的G系列模子恰是功课智能模子;进化智能则指向更深的问题,AI能弗成界说最优坐蓐力花式。

第二阶段是功课智能,指的是面向坐蓐力场景的有谋划订阅,这个市集领域比前两个阶段大出好几个数目级,基本等于在重写 GDP。

当今扫数这个词行业还在以整机销售为中心,莫得任何一家企业能在坐蓐力场景里着实干活。是以,着实的仗还没运转打。

智客ZhiKer:预试验阶段是否使用仿真数据?数据资本方面的压力奈何样?

高继扬:咱们目下试验全部使用确实数据,基本没用仿真数据。至少在达到 100 万小时数据之前,我看不到使用仿真数据的必要性,确实数据铺满那四个维度的速率更快、遵循也更好。

说到资本,我认为弗成光盯着数据的单向资本,得看智能总资本。它包括三块:数据资本、算力资本、研发资本。咱们在实践里,数据跟算力的比例差未几是 1:10,花一块钱采数据,至少得花十块钱作念试验。数据质地是压根,最高质地的数据即是确实数据。

具体数字的话,Human Centric 省略 50 到 100 块钱一小时,Robot Centric省略 250 块一小时。笼统算下来,100 万小时的数据资本省略在 1 到 2 亿东说念主民币。跟谎话语模子每年几亿好意思金的算力参加比,这笔钱必须花,并且很是合算。

智客ZhiKer:奈何从百万小时冲到千万小时?数据量上去之后,模子才略会有什么变化?

高继扬:咱们依托亦庄智能平台,走外包汇聚加众包汇聚两条路。众包是坐蓐奉陪式的,工东说念主普通干活的时辰带上开导,当然就采了;外包是针对特定任务,特意雇东说念主来采。

数据量上去,主要解决的是泛化问题,到新场景、接新任务,能弗成不加数据就处分。实施速率的栽植,靠的是后试验,跟工东说念主上岗前需要再培训一个意旨。

拿叠穿着例如,三个月前速率还极度慢,迭代到当今仍是快了许多。这个成长速率,致使比婴幼儿学期间还要快。

智客ZhiKer:如若众人都在冲击百万小时数据量,数据的壁垒是什么?

高继扬:99% 的具身智能数据是独罕有据。翌日具身智能模子能作念成什么样,很猛经由上就看数据好不好、对数据的相识深不深。

数据相识的通晓互异会传导到模子才略的互异,再传导到诓骗遵循和营业价值的互异,这是一个完满的链路。

智客ZhiKer:数据能否作念成标品,由第三方公司提供给各家诓骗企业?

高继扬:从表面业务模式上说,是不错的。

比如说海天瑞声,自己即是作念数据标品和奇迹的上市公司。但具身智能有个艰苦:整机、数据、模子试验这三件事耦合太紧了。数据采归来之后,算法的东说念主必须跟数采和运营的东说念主精采迭代,身手把数据质地提上来。

是以咱们作念了两件事:一是投了数采开导企业,二是跟亦庄控股等联接发起公司,把场景、开导、数据管线、模子需求这些东西握到一块,这么才有可能作念出高质地的标品数据集。

智客ZhiKer:数据、模子、整机,哪一块最进军?资源奈何分拨?

高继扬:政策上即是整机加智能,两者不可偏废。开释物理天下的坐蓐力,唯一模子不够,整机也需要蹧跶好的可靠性、一致性和负载才略。但从研发参加来看,智能的研发参加比整机最初一个数目级。

智客ZhiKer:G0.5 模子什么时辰用在 Kingo 双足机器东说念主上?

高继扬:G0.5 的模子架构是为双臂智能/轮式双臂品类准备的,会先诓骗在 R1Light、R1Pro 等居品上。Kingo 主力发展的是本能智能模子。

功课模子(VLA/天下模子)以师法学习为主、强化学习为辅;本能智能反过来,以强化学习为主、师法学习为辅。最终这两样会交融在沿路,可能是某种组合比例。比及本能和功课智能真融在沿路了,G0.5 的才略才会带到 Kingo 上。

智客ZhiKer:Kingo 的要道模组有什么特色?订价和营业化霸术呢?

高继扬:要道模组的话,咱们整机全部用 EC 通讯,同步性是行业里最佳的,但研发难度也最大。为此咱们在流控和中生机象凹凸了不少功夫,电机的电磁仿真、减慢器想象上也作念了许多优化。性能在第一梯队。

资本的话,这类居品的 BOM 最终会踏实在 1 万好意思金傍边,省略两年内能作念到。但资本自己未定定能弗成营业化,枢纽在于大脑颖异什么活。发挥国度劳能源一年省略 4 到 5 万好意思金,如若硬件一万好意思金、一年回本,剩下三四万好意思金即是智能的空间。

整机和供应链是有限游戏,智能和诓骗才是无尽游戏。作念整机是为了拿到背面无尽游戏的入场券。

智客ZhiKer:Kingo 搭载本能智能模子后,翌日的落地场景有哪些?

高继扬: 本能模子最低级阶段即是作念强化学习能作念的事,舞蹈、跑跳、行走,对应的是展演展示的营业化。才略再往上走,下一步是全身遥操作,等于有了一个良友化身,不错作念电站巡检之类的轻功课。再往后,本能智能跟功课智能交融起来,就能进制造业、建筑业这些非结构化场景作念重活了。

不外有少量要说了了欧洲杯体育,在深谷这种结构化场景里,轮式双臂其实更有上风,双足反而杂音大、遵循低。(本文首发钛媒体APP,文 | 智客Zhiker,作家|郭虹妘 )