7.ご褒美欲しさに努力する、あまりに「人間臭い」AIの学習方法 2.ディープラーニングだからこそ可能な「強化学習」
では、「強化学習」とはどのような原理なのでしょうか。
これは一言で言えば、「ある状態からある目的を達成できそうな一連の行動」を探す仕組みです。
たとえば、将棋や囲碁のようなゲームであれば、最終的に「勝利すること」が「目的」となります。
強化学習を行う場合には、この目的を達成する行動に対して、「報酬」を与えるようにします。
また、最初の状態から目的を達成する状態へと移行するまでには、何回かの行動を選択することになるわけですが、この行動の選択回数、いわば総数に応じて報酬を減衰させます。
すなわち、同じ目的に達する行動でも「早く達成したほうがもらえる報酬が多い」仕組みにしておくわけです。
このような仕組みで学習を行わせることによって、最終的により多くの報酬を得られるように、最初の状態から最も報酬の高い行動を取るように学習させる方式こそが強化学習なのです。
この報酬を算出する要素は、人がプログラミングするのではなく、AI自身が動的に追加したり削除したりします。
ですから、人には要素の数などはわかりますが、その要素がどういうものなのかは、正確なところはわからないケースもあります。
実際に、佐藤天彦名人を破ったポナンザの開発者も、イ・セドル九段を破ったアルファ碁の開発者も、AIがどのように報酬を獲得しているか、言い換えれば、「AIがなにを考えているのか」は理解できていません(これがわかるということは、AIでなくても、その開発者が将棋や囲碁で勝てるということになります)。
第4回、5回連載で説明した「ディープラーニング」の世界では、AIは報酬欲しさに自力で学習し、自らの知能を高めていくのです。
学習開始時は思いつきのような見当違いの行動を取っていたAIが、強化学習によって段々と成功体験・失敗体験から学んで、やがては人のプロも顔負けの緻密な行動を取るようになる様子は直感的にわかりやすいので、AI学習のPR映像にもよく使われます。
もしかしたら、みなさんの中にもテレビのAIの特集などで、そうした映像をご覧になったことがある人もいるかもしれませんね。
なお、「教師がいても、AIが強化されるのであれば、それも強化学習だ」と主張する学者もいますが、通常は強化学習は、教師あり学習の対義語として使われるケースが多いように思います。
この「AIの自己分割」のもととなっているディープラーニングをする「子どものAI」。
一方で、人が一から教えて丸暗記させる「大人のAI」。
同じAIといえども、両者でどれほどの違いが出るのかは、第1回連載の中で「子どものAI」であるGoogle翻訳と、「大人のAI」である別の翻訳サービスに同じ英文を日本語に翻訳させて、まったく異なる結果になるケースを紹介していますので、そちらを併せてお読みいただけたら幸いです。
『マルチナ、永遠のAI。~AIと仮想通貨時代をどう生きるか』
AIは、神のギフトか、破滅者か?
ディープラーニング、ビットコイン、ブロックチェーン・・・
これから、私たちの生活はどう変わるのか?
超AI時代を読み解くビジネス・エンターテイメント小説
→ Amazonへ
時は、東京オリンピックの喧騒が去った2020年。
岩科正真は、実家の定食屋の再建を、超美人AI『マルチナ』に託す決心をする。
正真は、再会した沙羅に惹かれるが、彼女には重大な秘密があった。
それを知った正真は、マルチナも愛してしまう。
ヒトとAIの奇妙な三角関係。
やがて、正真たちは巨悪な陰謀に巻き込まれていく。
彼らは、緻密に計算された策略を暴くことができるのか?
そんな彼らがたどり着く先は?
そして、マルチナに芽生えた「なにか」は、
プログラムなのか?
あなたはきっと、最後の1行に涙する
LINE@ 『ほぼ日刊マルチナ』始めましたー!
このQRコード、もしくは、 @zmv5952e で
友達検索してくださいm(_ _)m
最近の画像つき記事
-
ソフィア・ケニン、リヨン・オープン優勝!(女子テニス359)
-
ソフィア・ケニン、リヨン・オープン決勝進出!(女子テニス358)
-
ソフィア・ケニン、全豪オープン2020優勝!ガルビネ・ムグルッサを撃破!(女子テニス357)
-
ソフィア・ケニン、大大大金星!アシュリー・バーティーを撃破!(全豪オープン2020)(女子テニス356)
-
ソフィア・ケニン、勝つには勝ったが・・・(全豪オープン2020)(女子テニス355)
-
ココ・ガウフはなぜ負けたのか(全豪オープン2020)(女子テニス354)
-
大坂なおみは、なぜココ・ガウフに負けたのか(全豪オープン2020)(女子テニス353)
-
ワン・チャン、セレナ・ウィリアムズを撃破!ココ・ガウフ、大坂なおみを撃破(全豪オープン2020)(女子テニス352)
-
ベンチッチ、オスタペンコを撃破!(全豪オープン2020)(女子テニス351)
-
シャラポワはこのまま引退してしまうのか?(全豪オープン2020)(女子テニス350)
コメント (0件)
現在、この記事へのトラックバックは受け付けていません。
コメントする