人工知能(AI)、データサイエンス、ビッグデータ、確率・統計学などのブログ記事を通して、最新情報を伝えます。

始めよう!人工知能(AI)

記事

【記事】Google「DeepMind」の人工知能は赤ん坊のように「触って覚える・判別する」能力を学習したとの発表

投稿日:

Ai20161114 01

元記事はこちら。

By Warren R.M. Stuart

目の前にある物体の重さや壊れやすさなどの性質を知るためには、

人間であればまず「触ってみる」「つかんでみる」という行動を経て

どのようなものかを把握するもので、特に好奇心の強い子どもだと

「口に入れてみる」といった行動を取ることもあります。

そんな、人間のような「触ってみる」という行動を通じて

目の前の物体の特徴を把握することにGoogle DeepMind

人工知能(AI)が成功したことが発表されます。

(PDF)1611.01843v1.pdf

Ai20161114 02

Google DeepMind’s AI learns to play with physical objects | New Scientist

https://www.newscientist.com/article/2112455-google-deepminds-ai-learns-to-play-with-physical-objects/?

Google teaches DeepMind AI how to interact with real objects; squish puny humans

https://www.neowin.net/news/google-teaches-deepmind-ai-how-to-interact-with-real-objects-squish-puny-humans

Googleやカリフォルニア大学バークレー校らによる研究チームが

今後発表予定で、査読が行われている論文によると、

Google DeepMindでは実在する物体の重さを把握することが

できるAIロボットの開発に成功したとのこと。

これはいわば、人間が物体の性質を把握するために取る行動を

ロボットができるようになったことを意味しており、

ロボットが人間の能力を超える「シンギュラリティ(技術的特異点)」に

たどり着くためのステップをまた1つ登ったといえる出来事です。

研究では、同じ大きさで重さの異なる5つのブロックを

AIロボットの前に1列に置き、ロボットにどれが最も重いかを

当てさせる学習を繰り返します。

正しいものを選んだときにはプログラム的な報酬が与えられ、

間違ったものを選んだ場合にはネガティブフィードバックが

与えられて次回以降の動作が改善されます。

これらをもとに、AIロボットは報酬をよく得ることが

できる方法をいろいろとトライします。

最初はいわば「適当」にブロックを選んでいたという

AIロボットですが、学習を繰り返すうちに

「全てのブロックを持ってみて、一番重いものを選ぶ」

ということだけが正解にたどり着く唯一の方法であることを

学んだとのこと。

Ai20161114 03

次にロボットに与えられた課題でも、最大で5個の

ブロックを用いて同様に最も重いものを選ばせますが、

今回はブロックの配置を1列ではなく、

タワー状に積み上げるように変更されています。

ロボットはまず、そこに何個のブロックがあるのかを

把握するよう努め、最終的には同じように全てのブロックを

つかんでから正解を見つけるように行動したとのこと。

その中でロボットは、

「タワーを引っ張ることで積み上げられたブロックをバラバラにする」

という行為を覚えたそうです。

Ai20161114 04

今回のように報酬とネガティブフィードバックをもとに

AIロボットが機械学習を行うことは強化学習と呼ばれ、

DeepMindが2014年に発表した

「人間よりもゲームが上達したAI」の学習にも用いられていたものです。

Ai20161114 05

強化学習を行うことで、AIは人間や動物のように特別な指示が

なくても解決方法を見いだすことができるようになるとのこと。

シェフィールド大学のEleni Vasilaki教授は

「この能力により、既知の問題に対処するための新しい巧妙な方法や、

人間が指示を与えない状態でも解決策を見いだすことが

できるようになるでしょう」と語っています。

-記事
-

Copyright© 始めよう!人工知能(AI) , 2024 All Rights Reserved Powered by AFFINGER5.