中文搜索引擎指南网

标题: “人形机器人真的要走进日常生活了吗?”这个问题近来频繁引发讨论 [打印本页]

作者: sowang    时间: 前天 20:54
标题: “人形机器人真的要走进日常生活了吗?”这个问题近来频繁引发讨论
@中国科协科学技术传播中心

《科技青年说》首期 聊透具身智能那些事儿

“人形机器人真的要走进日常生活了吗?”这个问题近来频繁引发讨论。在短视频的镜头里,机器人进得工厂下得厨房,展现出多样化的应用场景。然而喧嚣之中,公众对具身智能机器人的态度兴奋和疑虑并存。一方面,具身智能产业正在以前所未有的速度进入公众视野,成为资本追逐与舆论热议的焦点;另一方面,技术成熟度的不确定、商业化进程的曲折、伦理与安全方面的隐忧,也让这股浪潮笼罩着复杂的色彩。

近期,聚焦前沿科技领域的对话类栏目《科技青年说》正式开播,首期节目邀请北京大学计算机学院研究员仉尚航,享刻智能技术(北京)有限公司创始人陈震,上海如身机器人科技有限公司创始人师云雷三位青年科技工作者围绕具身智能多个核心发展议题和热点争议展开深入对话。

仉尚航:拆解高级别具身智能的三大门槛与突破路径

机器人能力分级:导航成熟先行,操作规划成落地关键
仉尚航介绍机器人按核心能力可划分为三类:导航、操作、思考规划。当前三类能力的成熟度存在显著差异,以导航能力为主的机器人技术最为成熟,这也是扫地机器人、送餐机器人率先进入市场的主要原因;而以操作能力、思考规划能力为主的机器人发展因技术复杂度更高,则发展相对滞后,成为具身智能实现复杂功能、拓展应用场景的关键瓶颈。即便在工业场景中已经广泛应用的机械臂,仍主要依赖传统控制方式,在灵活性与通用性上存在明显不足。

三大技术路线:短期分层落地,长期端到端破局
针对“如何提升具身智能机器人的泛化能力”,仉尚航梳理了当前行业内三大主流技术路线:端到端大模型(VLA),旨在构建单一模型实现从感知到行动的全流程闭环,是她认为潜力最大的长远发展方向;“大脑+小脑”分层模型,是现阶段更具可行的方案,其中“大脑”(大模型)进行高层任务理解与规划,“小脑”(专用模型)负责底层精密控制,尤其适合长周期复杂任务;世界模型(World Model),通过让模型预测自身行动后的未来状态,构建“物理世界引擎”,以实现更准确、更安全的决策。
她认为,短期来看,“大脑+小脑”分层结构更易实现商业化落地,长期则需依赖端到端大模型突破泛化能力瓶颈。她透露,目前团队也正在推动两类技术的融合研究(如Faster in Slow)。

数据金字塔策略:破解数据稀缺难题
数据是训练具身智能模型的核心基础。针对数据稀缺的行业难题,仉尚航提出了“数据金字塔”策略,通过三层数据的协同应用,平衡数据量、质量与成本:底层是海量互联网视频数据,可用于预训练;中层是仿真合成数据,可无限生成用于调优;顶层是昂贵但高质量的真机数据。她强调,未来的关键在于设计巧妙的训练架构,通过“互联网数据预训练+仿真数据微调+少量真机数据校准”的组合模式,可在控制成本的同时,让模型高效适配真实物理场景,降低商业化落地门槛。

陈震:绕过AGI“奇点”,以硬件突破叩开垂直市场大门

商业化路径:降低硬件成本是激活市场的“关键按钮”
陈震认为,具身智能的商业化并不依赖于通用人工智能(AGI)的“奇点”到来,而应走“专用芯片驱动—硬件成本骤降—垂直场景爆发”的路径。他以扫地机器人的发展历程为参照,揭示消费级机器人规模化落地的规律:2010年前后,扫地机器人因价格昂贵还只是少数家庭的尝鲜产品。2015年市场出现1600元价位的高性价比机型后,行业迎来真正爆发。在他看来,当前具身智能正处于类似的临界点,若硬件成**显著下降,将触发市场“高光时刻”,快速激活多个垂直场景使用需求。

数据痛点:硬件标准化是打破“数据孤岛”的前提
数据层面,他指出当前行业存在“数据孤岛”:由于机器人硬件本体尚未标准化,各企业依据自身平台所采集的数据难以互通共用。他提出,整个行业亟须推出类似“智能手机”“自动驾驶汽车”的统一硬件标准,没有硬件标准,空谈数据规模是没有意义的。唯有在标准化硬件基础上,高质量数据才可能实现有效的积累、流动与价值释放。

价值回应:短期“表演”是长期发展的“基石积累”
针对公众对“人形机器人只是技术表演”的质疑,陈震以“登月计划”作比,阐释了当前技术展示的长远价值:虽然现阶段人形机器人的演示功能尚显稚嫩,但这一过程正倒逼底层算力、传感器、关节等核心部件快速迭代,当前的技术探索并非毫无意义的“炫技”,这些积累终将为未来行业爆发奠定关键基础。短期或是噱头,长期却具有战略价值。

师云雷:以“人机协同”为纲,警惕超越控制的强自主系统

安全边界:技术限定能力,“协作”而非“替代”
师云雷从安全性与伦理视角切入,强调具身智能的发展必须以“人类可控”为前提,以解决具体问题、提升生产效率为导向逐步推进。他提出,“机器人三定律”等科幻概念无法成为现实中的安全保障,唯一可行的路径,就是在技术上限定具身智能机器人的能力边界,尤其要避免在军事、公共安全等高风险场景中的滥用和外溢。在对未来人机关系的设想中,师云雷认为“人机协同”才是平衡技术进步与社会稳定的最优解,过度追求“替代”反而会引发就业、伦理等一系列问题。

技术成熟度:现阶段只能达到两三成
针对当前具身智能技术发展水平,师云雷认为目前成熟度只能达到两三成。尽管机器人已经实现自主导航、简单物品抓取等基础功能,但面对开放环境和复杂操作时仍显“力不从心”。以灵巧手为例,人类轻松高效完成的拧瓶盖、打字、折叠衣物等动作,对机器人来说,则需要突破高自由度控制、触觉反馈、材料与算法等多重技术难关。

软件之困:模型瓶颈制约硬件效能
针对“软件突破与硬件迭代何者更为关键”的争议,师云雷以手术机器人为例阐述了他的观点:尽管该领域硬件发展已三十余年且相对成熟,同时积累了千万例手术视频、操作数据可用于算法训练,例如达芬奇五代机器人发布时便明确聚焦手术数据采集和自动手术训练技术。即便具备这样的基础,现有模型仍仅能完成胆囊摘除等流程相对简单的手术任务,无法处理长周期、高复杂性或边界模糊的临床手术操作。他强调,在模型能力取得突破之前,即便硬件再成熟,也无法实现通用化智能。

三位嘉宾的深度对话,勾勒了具身智能产业的多维图景。尽管具身智能的发展在技术突破节奏、场景落地适配、伦理安全框架等方面仍需持续探索完善,但可以确定的是,具身智能已突破实验室的边界,不可逆地走入千行百业。热潮之下,具身智能的发展是一场关于技术、产业与社会的长期探寻,或许需要十年甚至更久的时间才能发现答案。但当下,嘉宾的每一次思考交锋与每一轮观点碰撞,正在让具身智能发展的轮廓愈发清晰可触。

【关于节目】
《科技青年说》是由中国科协科学技术传播中心打造的青年科技对话栏目。栏目紧密围绕国家创新驱动发展战略,聚焦青年科技人才在硬科技创新与产业转化前沿的突破性实践,构建开放场域,碰撞前沿智慧;打造青年窗口,输出科技观点;引领公众聆听,感受科技之美。




欢迎光临 中文搜索引擎指南网 (http://www.sowang.com/bbs/) Powered by Discuz! X3.2