[gtranslate]

7.ご褒美欲しさに努力する、あまりに「人間臭い」AIの学習方法 2.ディープラーニングだからこそ可能な「強化学習」

           <<最初のコラムへ      <このコラムの先頭へ

 

 

 

では、「強化学習」とはどのような原理なのでしょうか。

 

 

これは一言で言えば、「ある状態からある目的を達成できそうな一連の行動」を探す仕組みです。

 

 

たとえば、将棋や囲碁のようなゲームであれば、最終的に「勝利すること」が「目的」となります。

 

 

強化学習を行う場合には、この目的を達成する行動に対して、「報酬」を与えるようにします。

 

 

また、最初の状態から目的を達成する状態へと移行するまでには、何回かの行動を選択することになるわけですが、この行動の選択回数、いわば総数に応じて報酬を減衰させます。

 

 

すなわち、同じ目的に達する行動でも「早く達成したほうがもらえる報酬が多い」仕組みにしておくわけです。

 

 

このような仕組みで学習を行わせることによって、最終的により多くの報酬を得られるように、最初の状態から最も報酬の高い行動を取るように学習させる方式こそが強化学習なのです。

 

 

この報酬を算出する要素は、人がプログラミングするのではなく、AI自身が動的に追加したり削除したりします。

 

 

ですから、人には要素の数などはわかりますが、その要素がどういうものなのかは、正確なところはわからないケースもあります。

 

 

実際に、佐藤天彦名人を破ったポナンザの開発者も、イ・セドル九段を破ったアルファ碁の開発者も、AIがどのように報酬を獲得しているか、言い換えれば、「AIがなにを考えているのか」は理解できていません(これがわかるということは、AIでなくても、その開発者が将棋や囲碁で勝てるということになります)。

 

 

第4回、5回連載で説明した「ディープラーニング」の世界では、AIは報酬欲しさに自力で学習し、自らの知能を高めていくのです。

 

 

学習開始時は思いつきのような見当違いの行動を取っていたAIが、強化学習によって段々と成功体験・失敗体験から学んで、やがては人のプロも顔負けの緻密な行動を取るようになる様子は直感的にわかりやすいので、AI学習のPR映像にもよく使われます。

 

 

もしかしたら、みなさんの中にもテレビのAIの特集などで、そうした映像をご覧になったことがある人もいるかもしれませんね。

 

 

なお、「教師がいても、AIが強化されるのであれば、それも強化学習だ」と主張する学者もいますが、通常は強化学習は、教師あり学習の対義語として使われるケースが多いように思います。

 

 

 

 

この「AIの自己分割」のもととなっているディープラーニングをする「子どものAI」

 

一方で、人が一から教えて丸暗記させる「大人のAI」

 

 

同じAIといえども、両者でどれほどの違いが出るのかは、第1回連載の中で「子どものAI」であるGoogle翻訳と、「大人のAI」である別の翻訳サービスに同じ英文を日本語に翻訳させて、まったく異なる結果になるケースを紹介していますので、そちらを併せてお読みいただけたら幸いです。

 

 

次のコラムへ>

 

 

 

 

『マルチナ、永遠のAI。~AIと仮想通貨時代をどう生きるか』

 

 

AIは、神のギフトか、破滅者か?


ディープラーニング、ビットコイン、ブロックチェーン・・・

 

これから、私たちの生活はどう変わるのか?

 

超AI時代を読み解くビジネス・エンターテイメント小説

 

martina_cover2

 

 

→ Amazonへ

 

 

 

時は、東京オリンピックの喧騒が去った2020年。


岩科正真は、実家の定食屋の再建を、超美人AI『マルチナ』に託す決心をする。

 

正真は、再会した沙羅に惹かれるが、彼女には重大な秘密があった。

 

それを知った正真は、マルチナも愛してしまう。

 

ヒトとAIの奇妙な三角関係。

 

やがて、正真たちは巨悪な陰謀に巻き込まれていく。

 

 

彼らは、緻密に計算された策略を暴くことができるのか?
そんな彼らがたどり着く先は?

 

そして、マルチナに芽生えた「なにか」は、
プログラムなのか?

あなたはきっと、最後の1行に涙する

 

 

 

 

LINE@ 『ほぼ日刊マルチナ』始めましたー!

 

 

このQRコード、もしくは、 @zmv5952e で

友達検索してくださいm(_ _)m

コメント (0件)

現在、この記事へのトラックバックは受け付けていません。

コメントする

Diamondo Blog イチオシ芸能ニュースもっと見る

ピックアップブロガーもっと見る

インタビュー特集もっと見る

 

大村あつしプロフィール

プロフィール画像

大村あつし

1996年8月にエーアイ出版より『Excel95で作るVBAアプリケーション〜 VBAで作る販売管理システム〜』でITライターとしてデビューしたが、2007年6月にゴマブックスより出版された『エブリ リトル シング〜人生を変える6つの物語〜』で小説家に転身。まだ、IT書籍の執筆は一部、続けているが、現在の活動は小説が中心となっている。

プロフィール詳細 »

読者になる

このブログの更新情報が届きます。

無料で読めるweb小説

小説を読む
ブログモバイル版

携帯ではこちらのQRコードより ご確認ください

http://www.diamondblog.jp
/official/omura/

大村あつし最近の記事

大村あつし

大村あつしアーカイブス

大村あつしカレンダー

2018年4月
« 3月   5月 »
 1
2345678
9101112131415
16171819202122
23242526272829
30