首页 科技新闻 正文

从工业臂到家庭手:具身智能的“三级跳”如何重塑人机关系?——对话光象科技CEO张涛

当大多数企业还在为“多模态大模型+机械臂”的组合找落地场景时,光象科技CEO张涛给出了一个清晰的路径图:具身智能的演进,必须是“工业→商业→家庭”的三级跳。这个观点看似循规蹈矩,实则暗含了对技术成熟度曲线和人类接受心理的深刻洞察。

**工业:先让机器学会“干活”,而不是“跳舞”**

张涛的逻辑起点很务实——工业是具身智能最理想的“训练场”。原因有三:第一,工业场景结构化强,环境变量可控。流水线上的抓取、搬运、装配,动作相对固定,传感器和算法的容错空间可以逐步收窄。第二,工业客户对ROI敏感但容忍度高。一台协作机器人哪怕只能替代半个工人,在24小时连续作业下,两年回本是可以量化计算的。第三,工业数据的“信噪比”高:每一次抓取失败、每一次路径偏差,都能转化为明确的负样本去修正模型。

但张涛特别强调一点:工业具身智能不应追求“万能手”,而应该聚焦“专能手”。光象科技的第一代产品并没有去做通用灵巧手,而是针对3C制造中的精密装配设计了专用末端执行器,配合视觉语言模型进行微调。这种“窄域深度”的策略,让公司在半年内就拿到了头部代工厂的复购订单。

**商业:从“安全围栏”到“共享空间”的惊险一跃**

从工业跨入商业场景,是整个路径中最容易被低估的难点。张涛认为,商业场景(如餐厅传菜、酒店引导、商场清洁)表面看是“降维”,实际是“换维”——环境从结构化变成半结构化甚至非结构化。灯光变化、行人遮挡、突发对话、地面湿滑……这些都是工业场景中几乎不存在的扰动。

更致命的是人机距离的剧变。工业环境中机器人有安全围栏,而商业场景里机器人必须与人类共享动线。这要求具身智能不仅要有感知能力,更要有“社会意识”——它需要理解排队秩序、判断幼儿突然冲出、甚至根据人群密度调整行走速度。张涛举了一个例子:光象科技在测试送餐机器人时发现,单纯靠激光雷达避障会导致机器人频繁急停,反而让客人不知所措。后来他们加入了视觉情感模块——通过摄像头识别前方行人的肩部朝向和微表情,预判其是否准备让路,才把交互流畅度提升到可商用水平。

商业场景的另一大价值在于数据多样性。工业数据偏向“动作-结果”的二元关系,而商业数据蕴含大量“意图-动作-反馈”的复杂回路。张涛特别提到,光象科技在商场部署的导览机器人,每天能收集到数千次“指路-确认-纠错”的对话记录,这些数据对训练具身智能的主动感知能力至关重要。

**家庭:终极场景的“三道坎”**

张涛直言,家庭场景是具身智能的“珠穆朗玛峰”,而且目前还没有人真正登顶。即便是光象科技,也预计至少还需要三代迭代才能推出面向家庭的通用产品。在他看来,家庭场景存在三道难以逾越的坎:

第一道坎是“成本与价值的错配”。工业机器人单价几十万,但替代的是年薪十万的人工,两三年回本。家庭机器人如果定价五万,用户期望它既能打扫、又能做饭、还能陪老人聊天——但以当前技术,一台机器人只能专注做一两件事,用户会认为“不值得”。张涛认为,家庭场景必须等到核心零部件的成本下降一个数量级,同时算法的泛化能力足够让一台机器完成至少五种高频家务,才能真正引发刚需。

第二道坎是“安全与信任的黑盒”。工业场景中,系统故障可以由工程师介入;商业场景中,机器人有管理员监控;但家庭用户面对一台可能切菜、可能抱小孩的机器人,任何一次不可解释的异常动作都会摧毁信任。张涛透露,光象科技正在研发“可解释具身模型”——当机器人决定执行某个动作时,会通过语音或投影向用户解释“为什么这么做”,让用户拥有最终否决权。这不仅是技术问题,更是一种交互伦理设计。

第三道坎是“情感连接”。这或许是最玄学也最关键的一点。张涛认为,家庭机器人不能仅仅是工具,它需要在“有用”和“有温度”之间找到平衡。工业机器人不需要性格,商业机器人可以有小脾气(比如送餐机器人会说“请让一下,我赶时间”),但家庭机器人必须学会察言观色——知道家人心情不好时保持安静,知道孩子需要鼓励时给予正向反馈。这种情感计算目前还停留在非常初级的阶段,但它决定了家庭具身智能是“被接受”还是“被当成高级玩具”。

**独特洞见:家庭不是工业的“降级版”,而是“升维版”**

张涛的一个核心观点颠覆了行业普遍认知:很多人觉得家庭场景复杂度不如商业和工业,所以只要把工业方案做小、做便宜就能进入家庭。但他指出,工业追求“确定性的高效”,而家庭需要“不确定性的陪伴”。一个在工厂里能精准抓取螺丝的机械臂,一旦放到家里面对乱放的锅碗瓢盆、不同形状的厨房用具,反而会频繁出错——因为家庭环境的“特征分布”和工业完全不同。

因此具身智能的进化路径不是简单的“大→小”“贵→便宜”,而是要从控制逻辑切换到协作逻辑。工业机器人是“被编程的奴隶”,商业机器人是“有边界的雇员”,而家庭机器人必须是“有默契的伙伴”。这要求整个技术栈从底层重构:感知模块要处理更多语义信息(比如识别“这杯水是烫的还是凉的”),规划模块要包含社会规范(比如不能在工作时间打扰主人),控制模块要容忍人类不完美的交互(比如孩子突然拽住机器人的手臂)。

**结语:路很长,但方向已明**

张涛并不避讳技术天花板的存在。他坦言,光象科技目前80%的收入仍来自工业场景,商业场景还在亏损,家庭场景只有实验室样机。但他相信,这条路径最大的价值在于“用商业化喂养技术”——工业赚的钱投入到商业场景的算法优化,商业积累的数据反哺家庭场景的模型训练。当有一天,一台具身智能机器人在家庭里能同时完成叠衣服、做饭、哄睡三件事,并且用户觉得它“不可或缺”时,人们才会意识到,这场从工业臂开始的进化,最终改变的不是效率,而是人与人、人与机器之间的相处方式。

(注:本文基于与光象科技CEO张涛的深度对话整理,不代表张涛本人立场,仅作为行业观点呈现。)