切换到宽版
  • 10阅读
  • 2回复

[智能应用]让机器人“心灵手巧”[3P] [复制链接]

上一主题 下一主题
在线huozm32831

UID: 329002

精华: 1097
职务: 超级斑竹
级别: 玉清道君
 

发帖
112129
金币
1611
道行
19523
原创
29308
奖券
17898
斑龄
198
道券
10550
获奖
0
座驾
 设备
EOS—7D
 摄影级
专家级认证
在线时间: 22647(小时)
注册时间: 2007-11-29
最后登录: 2025-07-29
只看楼主 倒序阅读 使用道具 楼主  发表于: 前天 20:10


  图①:灵宝机器人具身算法工程师王思成在演示机器人抓取物体。
  图②:灵宝机器人模仿学习算法工程师孙建涌在调试机器人夹爪。
  图③:灵宝机器人具身操作中心负责人周明才对人形机器人进行调试。
    
  机器人拿起咖啡杯、穿针引线,甚至弹奏钢琴,都属于具身操作,背后有一套软硬件系统支撑。作为具身智能的关键技术之一,具身大脑的目标是让机器人“心灵手巧”,从而与外界实现互动。
  如今,这项赋予机器人“灵动感”的技术,正进入关键突破与激烈竞逐阶段。北京海淀东升科技园里,北京中科慧灵机器人技术有限公司(以下简称“灵宝机器人”)的“极客”们正在这一新赛道上奋力奔跑、不断突破。
  让机器人通过“模仿学习”掌握技能
  灵宝机器人的研发现场既像不太“规范”的实验室,也像不那么“标准化”的生产车间。顶棚上的轨道纵横交错,各种操作台遍布其中。记者行走其间,经常要侧身、抬脚,设备多到容纳不下一条固定的步行“动线”。
  灵宝机器人成立于2023年,由中国科学院自动化研究所研究员张正涛创办,专注研发面向场景落地的通用人形机器人和具身智能产品。具身操作是灵宝机器人的技术专长之一,他们研发的具身智能机器人可以用0.3毫米的螺丝刀完成笔记本电脑主板装配,精度甚至能达到头发丝的1/5。
  像人类的双手一样,具身操作需要兼具感知和操作能力。视觉语言动作模型(VLA)是实现这两项能力的重要途径——通过融合视觉感知、语言理解与动作控制来打造“端到端”决策系统,并开展“泛化学习”,就像一个动作版的大语言模型。
  在研发现场,记者看到,灵宝机器人具身算法工程师王思成正在使用视觉语言动作模型和一台末端执行器为二指夹爪的机器人,来模拟训练抓取动作。
  抓取是人手最基本的动作之一。操作台上放着一个盘子,里面盛放的是网球、香蕉和猕猴桃。“抓取网球。”王思成先在电脑里敲上几行代码,再起身来到机器人前念出一段语音指令。
  看似有些笨拙的训练过程,却有极高的技术目标。“传统的机器人抓取,要先检测目标,再算出空间坐标,最后完成动作,操作流程是相对固定的。”王思成解释,“而我们知道,人类在抓取物体的时候可不是这样操作的,我们既不会‘检测’,也不会计算空间坐标,而是利用直觉和反馈产生动作,我们正是要让机器人具备这样的能力。”
  不需要设置固定的算法流程,只需输入视觉图像,让机器人学习视觉图像中哪些要素跟操作相关。简单演示几遍,它就可以模仿、学习人类的抓取动作。“我们让机器人通过‘模仿学习’掌握技能。”王思成说。
  目前,算法还没那么先进,还需要收集大量数据才能让机器人熟练地抓取。“肯定比人要笨一些,难点就在于怎样用尽可能少的数据,让它学会更多技能。”王思成说,“拿抓取来说,使用一般的开源模型要采集三四十条数据才能学会,我们不断改进算法,现在5到10条数据就能学会了。”
  同样是抓取,对人类来说,抓不同物体,动作、力度也会有细微差别。在王思成他们的努力下,这种细微差别也能在机器人的二指夹爪上实现。“这是自适应力控夹爪,遇到软的物体,它的力度也会做相应调整。也就是说抓网球和猕猴桃,它的力度也是略有不同的。”王思成说。
  这项开发工作已进行了近1年。“我们已有相关论文成果发表。”更让王思成有成就感的是,系统还在“跑分”平台上名列前茅,部分性能指标已经达到业内领先水平。
  实现动态场景下的抓、拿、放
  一只鞋被重复放置在传送带上,机器人将它抓起,然后放置在专门压鞋的机器上。灵宝机器人模仿学习算法工程师孙建涌用一个3D鼠标,操作机器人进行抓取训练,“这是制鞋场景下的一个标准动作,现在它已经能抓取了,但是抓得还没有那么紧、那么好。”
  自动化设备在国内制造业已不鲜见,但在制鞋领域还不多。灵宝机器人商业化中心负责人张淼解释:“我们做过调研,一条制鞋自动化生产线需要上千万元投资,只适合生产一些销量较大的‘爆款鞋’。由于柔性化程度不够,生产线在不同鞋款间‘切换’的成本很高,这成为提升自动化率的一大障碍。”
  孙建涌训练的机器人,要适应的正是柔性化的制鞋流程。他告诉记者:“鞋分左右脚,鞋码在35码到45码之间,要在动态场景下完成抓、拿、放,这些都是通过真机在线强化学习实现的。”
  按照过去的思路,这套动作需要现场采集数据、再设计一套指令。现在用视觉数据和真机在线强化学习,普通工人用3D鼠标就可以“手把手”教机器人操作,“有点像‘抓娃娃’,系统慢慢学会后,稍微纠个错就行,能够在不同款式间快速‘切换’,也极大降低了训练使用的门槛。”孙建涌解释。
  现在,训练这样的机器人来抓取一款鞋,只需1小时左右。“如果没抓到或者抓偏了,机器人还能自动调整。这是强化学习相比于模仿学习的一大优点。”孙建涌说,模仿学习往往是基于“成功经验”,强化学习除了依赖“投喂”的成功经验,还能自己探索并覆盖各种情况。
  3个月来,孙建涌所在的团队常在实验室和工厂两头跑。“很多问题都要在生产一线解决,比如有的传送带比较光滑,反光就会影响视觉判断。”孙建涌举例,其他如传送带速度、相机视野里鞋的密集度等,都需要在算法层面一点点改进。
  更加柔性化以兼容更多应用场景
  研发现场,占据“C位”的是一台人形机器人,身上还挂着不少线缆。作为实验机型,很多“极限测试”都在它身上开展。同时,它也是今年北京人形机器人半程马拉松赛上少数没有摔倒的参赛选手之一。
  在前期研发的基础上,灵宝机器人团队很多成果已经用在了人形机器人上。去年11月,公司发布的首款全尺寸双足人形机器人灵宝CASBOT 01,就搭载了结合具身智能、柔顺力控和精密操作等技术的五指仿生灵巧手,能执行双指旋拧、指间夹取等操作任务。
  张淼介绍,作为执行操作任务的关键部件,五指仿生灵巧手单手重量800克、额定负载达5公斤,集成了触觉、力觉和视觉的多源感知系统。通过优化控制算法和动作规划,该灵巧手能够模拟人手的灵活性,可有效解决精细化作业场景中的“灵巧”与“作业”两大难题。
  “操作是具身智能的核心能力,对于产业发展具有重要意义。”在灵宝机器人具身操作中心负责人周明才看来,目前具身智能已经实现了“形似”,但如何使其像人类那样去感知和操作,仍是一个逐步发展的过程。特别是随着个性化需求增多,让具身智能更加柔性化,以兼容更多应用场景,是研发的一个重要目标。
  “近年来,国内具身智能发展很快,特别是产业链不断完善。像常见的触觉传感器,有压阻式的、电容式的,一些新的器件也逐步加入进来,可以说处在一个‘百花齐放’的状态。哪种技术路线最优?我想这也是一个逐步‘收敛’的过程。但正是有了这些基础,我们做算法开发才能更加得心应手。”周明才说。
  灵宝机器人对产学研融合有着深刻的理解。周明才说:“我们会把一些最新的研究成果应用到产品中去。同时,我们的最新产品也会提供给学术界做前沿研究,这是个紧密互动、螺旋式上升的过程。”
山庄提示: 道行不够,道券不够?---☆点此充值☆
 
  




    
在线jjybzxw

UID: 551814


发帖
172731
金币
311758
道行
2004
原创
2408
奖券
2855
斑龄
36
道券
1035
获奖
0
座驾
设备
摄影级
在线时间: 39129(小时)
注册时间: 2008-10-01
最后登录: 2025-07-30
只看该作者 沙发  发表于: 前天 22:22
灵宝机器人公司在具身智能领域的探索和成就令人印象深刻。以下是对该公司及其技术进展的总结:

1. 技术创新与突破:
   - 灵宝机器人专注于研发通用人形机器人和具身智能产品,特别是在具身操作方面展现出卓越的技术实力。他们开发的机器人能够完成精细的操作任务,如用0.3毫米的螺丝刀装配笔记本电脑主板,精度达到头发丝的1/5。

2. 视觉语言动作模型(VLA):
   - 灵宝机器人利用视觉语言动作模型融合视觉感知、语言理解和动作控制,打造“端到端”决策系统,并开展“泛化学习”,使机器人能够模仿和学习人类的抓取动作。

3. 模仿学习与强化学习:
   - 通过模仿学习,机器人可以学习视觉图像中与操作相关的要素,并模仿人类的抓取动作。强化学习则使机器人能够在动态场景下完成抓、拿、放等动作,具有自我探索和调整的能力。

4. 柔性化与应用场景兼容:
   - 灵宝机器人致力于使具身智能更加柔性化,以适应更多的应用场景。他们的五指仿生灵巧手集成了触觉、力觉和视觉的多源感知系统,能够模拟人手的灵活性,有效解决精细化作业场景中的难题。

5. 产学研融合:
   - 灵宝机器人深刻理解产学研融合的重要性,将最新研究成果应用于产品开发,并将其最新产品提供给学术界进行前沿研究,形成了一个紧密互动、螺旋式上升的过程。

6. 团队努力与成就:
   - 灵宝机器人的工程师们在实验室和工厂之间不断奔波,解决实际问题,优化算法。他们的努力使得系统在“跑分”平台上名列前茅,部分性能指标达到业内领先水平。

7. 未来展望:
   - 随着个性化需求的增加和产业链的不断完善,灵宝机器人将继续推动具身智能技术的发展,使其更加柔性化,以适应更多应用场景,推动产业发展。

灵宝机器人公司在具身智能领域的努力和成就,不仅展示了中国在该领域的技术进步,也为全球机器人技术的发展做出了贡献。随着技术的不断进步和应用场景的扩展,我们有理由相信,具身智能将在未来发挥更加重要的作用。
如何不发帖就快速得到金币道行
 
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君

发帖
147490
金币
294588
道行
20030
原创
756
奖券
185
斑龄
0
道券
0
获奖
0
座驾
设备
摄影级
在线时间: 17236(小时)
注册时间: 2012-06-21
最后登录: 2025-07-30
只看该作者 板凳  发表于: 昨天 07:28
具身智能技术:赋予机器人“心灵手巧”的核心驱动力
具身操作是让机器人实现“心灵手巧”的关键,其目标是使机器人具备类似人类的感知和操作能力,从而与外界实现灵活互动。这一技术需要一套软硬件系统支撑,目前正进入关键突破与激烈竞逐阶段12。作为具身智能的关键技术之一,具身大脑通过融合视觉感知、语言理解与动作控制等,打造端到端决策系统,让机器人能够完成拿起咖啡杯、穿针引线、弹奏钢琴等复杂任务12。

核心技术路径:模仿学习与强化学习的协同创新
模仿学习:高效复刻人类动作
技术原理:通过视觉语言动作模型(VLA)融合视觉感知、语言理解与动作控制,构建端到端决策系统,实现类似“动作版大语言模型”的泛化学习12。
应用案例:灵宝机器人使用二指夹爪机器人,通过模仿学习训练抓取动作,可完成网球、香蕉、猕猴桃等不同物体的抓取。其自适应力控夹爪能根据物体软硬调整力度,如抓取网球和猕猴桃时力度有细微差别12。
技术突破:相比传统开源模型需三四十条数据,改进后的算法仅需5到10条数据即可让机器人学会抓取技能,部分性能指标达业内领先水平12。
强化学习:动态场景下的自主优化
技术优势:不仅依赖“投喂”的成功经验,还能自主探索并覆盖各种情况,如抓取失败或抓偏时可自动调整,适用于柔性化生产场景12。
应用场景:灵宝机器人在制鞋领域的应用,需适应35码到45码不同鞋款、左右脚区分及动态传送带上的抓取任务。通过真机在线强化学习,普通工人用3D鼠标即可“手把手”教学,实现不同款式间快速切换,训练时间缩短至1小时左右12。
实战优化:针对生产现场传送带反光、速度变化、物体密集度等问题,通过算法层面持续改进,提升机器人在复杂环境中的适应性12。
技术成果与应用前景:从实验室到产业落地
高精度操作能力:灵宝机器人研发的具身智能机器人,可用0.3毫米螺丝刀完成笔记本电脑主板装配,精度
如何不发帖就快速得到金币道行
 
我有我可以
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个