AIを利用して、シンプルなロボットグリッパーで最大限の把持を実現する新しい研究成果 New Work Uses AI To Maximize Grasping With Simple Robot Grippers
2023-02-21 カーネギーメロン大学
◆David Held助教授と共同で研究しているロボット工学研究所の博士課程学生Wenxuan Zhouは、人工知能を使って、ロボットを何かに押し付けてアイテムを拾い上げるように教え、それを横にして握らせることに成功しました。彼女の研究は、より複雑で高価なロボットハンドにしかできなかった方法で、シンプルなロボットグリッパーが、掴みにくい物体を拾い上げ、操作することを可能にしました。
◆多くの場合、ロボットはアイテムの上部をつかんでピックアップするように訓練されていますが、これは大きなオブジェクトや箱に入っていない、または箱のような形をしていないアイテムを扱う際に問題となります。周のシステムによって、ロボットは対象物を壁などの垂直面に押し付け、回転させ、その側面をつかむことを学習する。
◆把持できないものを把持するために、周は外在的な器用さ、つまり手以外のリソースを使って手にある物体を操作することに着目した。まず、強化学習によってニューラルネットワークを学習させ、そのニューラルネットワークがロボットに、周囲の環境にある物体を把握するための外在的器用さを教え込む。この場合、ロボットは壁などの垂直面の助けを借りて、グリッパーの中の物体を操作する。
◆これまでの外在的器用さとロボティクスに関する研究では、ロボットがどのように物体に接触するかという仮定に基づいて、物体を把持するためのシステムを設計することが多かった。また、これらのシステムでは、より複雑なハンドやロボットが必要とされることもあった。周はAIを利用して、ハードウェアの制約が少なく、さまざまな対象物に対応できるシステムを開発した。
◆周は、サイズや質感の異なる箱、ペットボトル、食品容器、財布など、8つのアイテムを用いてこのシステムをテストした。このシステムで訓練したロボットは、78%の確率で対象物を掴み、持ち上げることに成功しました。
◆「壁があるビンに対象物を入れましたが、壁を使って対象物をつかむように指示はしていません。「アルゴリズムは、物体を横にしてつかむことが課題であることを認識しており、シミュレーションで試行錯誤しながら、壁を使うことが最良の行動であると判断したのです」。
◆Zhouは、今年12月にニュージーランドのオークランドで開催されたロボット学習学会で、「Learning to Grasp the Ungraspable With Emergent Extrinsic Dexterity」という研究成果を発表しています。
<関連情報>
- https://www.cs.cmu.edu/news/2023/grasping-the-ungraspable
- https://sites.google.com/view/grasp-ungraspable
創発的な外在的器用さにより、つかめないものをつかむことを学習する Learning to Grasp the Ungraspable with Emergent Extrinsic Dexterity
Wenxuan Zhou, David Held
Conference on Robot Learning (CoRL) 2022 (Oral)
Abstract
A simple gripper can solve more complex manipulation tasks if it can utilize the external environment such as pushing the object against the table or a vertical wall, known as “Extrinsic Dexterity.” Previous work in extrinsic dexterity usually has careful assumptions about contacts which impose restrictions on robot design, robot motions, and the variations of the physical parameters. In this work, we develop a system based on reinforcement learning (RL) to address these limitations. We study the task of “Occluded Grasping” which aims to grasp the object in configurations that are initially occluded; the robot needs to move the object into a configuration from which these grasps can be achieved. We present a system with model-free RL that successfully achieves this task using a simple gripper with extrinsic dexterity. The policy learns emergent behaviors of pushing the object against the wall to rotate and then grasp it without additional reward terms on extrinsic dexterity. We discuss important components of the system including the design of the RL problem, multi-grasp training and selection, and policy generalization with automatic curriculum. Most importantly, the policy trained in simulation is zero-shot transferred to a physical robot. It demonstrates dynamic and contact-rich motions with a simple gripper that generalizes across objects with various size, density, surface friction, and shape with a 78% success rate.