7.ご褒美欲しさに努力する、あまりに「人間臭い」AIの学習方法 1.成功したらAIにご褒美を上げる「強化学習」とは？

投稿日：2018.04.02｜カテゴリー：マルチナ、永遠のAI。

　　　　　　　　　　　　　　　　　　　＜＜最初のコラムへ　　　　　　　　　

前回の第6回連載では、将棋AIの『ポナンザ』が、自分自身を二分割する「AIの自己分割」という手法で自己対戦を七百万局もこなして、2017年の第二期電王戦で佐藤天彦（あまひこ）名人に勝利したエピソードを紹介しました。

このケースもそうですし、囲碁で2016年にGoogleの『アルファ碁』(AlphaGo)がイ・セドル九段を破ったケースでも、実はある学習方法を活用していました。

それが「強化学習」と呼ばれるものですが、まずは強化学習よりもわかりやすい例として「教師あり学習」について簡単に紹介します。

教師あり学習は、読んで字のごとくなのですが、人が教師となってAIに学習させる方法で、特にAIの画像認識の向上に大きく寄与しました。

たとえば、AIに犬の画像を見せます。

そして、AIが「犬」と答えたら、AIに「正解」という情報をインプットします。

逆に、「猫」と答えたら、AIに「不正解」という情報をインプットします。

このように、人がAIに正解・不正解を教えながら、パラメータ（AIへの指示事項）を調整し、「AIをより賢くしていく学習方法」を「教師あり学習」と呼びます。

この教師あり学習は、画像認識のように正解・不正解が明白なときには有効な手段です。

「犬だけど、猫でもある」なんて解答はないわけですから、人が教えやすい分野です。

また、画像認識であれば、教師である「人」にも高度な知識は必要ありませんので、そうした意味でも教師あり学習との親和性が高い分野と言えるでしょう。

ところが、これが将棋や囲碁となると話はまったく変わります。

仮に、佐藤天彦名人に勝てるような将棋AIを教師あり学習で教育しようとしたら、教師である「人」が佐藤天彦名人に勝てるようでなければ、正解か不正解かをAIに教えることはできません。

同様に、イ・セドル九段より優秀な「人」が教師にならなければ、囲碁で勝つことはできません。

ところが、「人」という枠組みの中で見ると、佐藤天彦名人もイ・セドル九段も「最も優秀な人」ですので、AIが選んだ手が正解なのか不正解なのかは、「教師」にも判断がつきません。

このようなケースでは、教師あり学習ではAIをより強くすることはできません。

そして生み出された学習方法が「強化学習」、別名、「教師なし学習」です。

次のコラムへ＞

『マルチナ、永遠のAI。～AIと仮想通貨時代をどう生きるか』

AIは、神のギフトか、破滅者か？

ディープラーニング、ビットコイン、ブロックチェーン・・・

これから、私たちの生活はどう変わるのか？

超AI時代を読み解くビジネス・エンターテイメント小説

→　Amazonへ

時は、東京オリンピックの喧騒が去った2020年。

岩科正真は、実家の定食屋の再建を、超美人AI『マルチナ』に託す決心をする。

正真は、再会した沙羅に惹かれるが、彼女には重大な秘密があった。

それを知った正真は、マルチナも愛してしまう。

ヒトとAIの奇妙な三角関係。

やがて、正真たちは巨悪な陰謀に巻き込まれていく。

彼らは、緻密に計算された策略を暴くことができるのか？
そんな彼らがたどり着く先は？

そして、マルチナに芽生えた「なにか」は、
プログラムなのか？

あなたはきっと、最後の１行に涙する

LINE@　『ほぼ日刊マルチナ』始めましたー！

このQRコード、もしくは、　@zmv5952e　で

友達検索してくださいm(_ _)m

最近の画像つき記事

Check

コメントする

2018年4月
月	火	水	木	金	土	日
« 3月		5月 »
	1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

2018年4月

月

火

水

木

金

土

日

« 3月

5月 »

大村あつしオフィシャルブログ

インフォメーション