佰感交融 机智过人
从视觉感知到自然语言:Hello Robot 具身智能平台的机器人意图表达实践
核心创新:任务无关的机器人意图自然语言生成
卡内基梅隆大学与本田美国研究院提出的CoRI(Communication of Robot Intent)流程,突破了物理人机交互(pHRI)中机器人意图沟通的瓶颈。该流程的创新性在于其通用性——无需为特定任务编写任何规则,仅依靠机器人的实时视觉感知和运动规划轨迹,即可自动生成用户能直观理解的自然语言。

CoRI的沟通涵盖三个关键维度:
1、任务级意图:说明机器人行动的整体目标(如“协助洗浴”)。
2、运动细节:描述轨迹形状、速度变化、力度应用(如“从手腕向手肘匀速移动,并逐渐加大力度”)。
3、用户协作:清晰告知需要用户如何配合(如“请保持手臂稳定”)。
这种全面的沟通方式,使非专业用户也能轻松理解并预测机器人的行为,为安全、顺畅的协作奠定基础。
实证效果:在多任务辅助场景中验证优异性能
研究团队在洗浴、剃须、喂食三类具有代表性的辅助任务上对CoRI进行了全面评估。统计结果表明,与传统的脚本沟通或无沟通相比,CoRI在提升用户对机器人意图的理解度、动作预测信心方面产生了显著积极影响。
更为重要的是,通过自然语言推理模型评估,CoRI生成的语句在信息准确性上接近理想水平(平均蕴含概率达0.95),证明其能可靠地传达机器人计划的真实意图,且不会产生误导性信息。

平台支撑:Hello Robot Stretch3——高效验证算法的科研利器
CoRI研究的成功,离不开Hello Robot 移动操作机器人Stretch3 这一稳健的科研平台。Stretch3具备的移动灵活性、精准操作能力以及开放易用的软硬件接口,使得研究人员能够快速部署和验证像CoRI这样复杂的算法管道,将更多精力集中于核心算法创新,而非底层硬件调试,有效加速了科研进程。

总结:CoRI研究为人机协作机器人迈向更智能、更体贴的助手角色提供了关键技术路径,而Hello Robot Stretch3则作为可靠的创新载体,持续赋能全球科研工作者探索具身智能的更多可能性。

引用来源:
CoRI: Communicating Robot Intentions via Vision-Language Models
IEEE International Conference on Robotics and Automation (ICRA) 2025
作者:S. S. Srinivasa, A. Steinfeld, M. Ciocarlie, et al.
论文链接:https://cori-phri.github.io/
