本文に移動
全体  > 経済

アルファ碁に百戦全勝した“アルファ碁ゼロ”公開

登録:2017-10-19 22:57 修正:2017-10-20 08:06
ネイチャー「人間の知識借りずに囲碁をマスター」論文掲載 
ハサビス創業者など“アルファ碁ゼロ”開発者17人が共同で 
棋譜や対局相手なしでセルフ対局、道理を悟る 
ハサビス「人間の限界を越える人工知能研究の里程標」
昨年3月に開かれた「グーグル・ディープマインド・チャレンジ」で、イ・セドル九段とアルファ碁が対局している=グーグル提供//ハンギョレ新聞社

 グーグルの人工知能(AI)技術開発子会社のディープマインドが、韓国の李世ドル(イ・セドル)九段や中国の柯潔九段など人間の名棋士を相次いで撃破した囲碁プログラム“アルファ碁”を凌駕する新しい囲碁プログラム“アルファ碁ゼロ”を公開した。囲碁の教科書や棋譜はもちろん、対局相手の手も借りずに独学で囲碁を習得し、人間に勝った既存のアルファ碁プログラムも圧倒する能力を備えた。

 ディープマインドのデミス・ハサビス創業者兼最高経営者を含め、この会社の研究員17人はアルファ碁ゼロのアルゴリズムとこれまでのテスト結果を含む「人間の知識を借りずに囲碁をマスターすること(Mastering the game of Go without human knowledge)」というタイトルの論文を19日(韓国時刻)発表した。この論文は、世界的な科学学術誌『ネイチャー』に載せられた。

 論文によれば、アルファ碁ゼロは囲碁の規則以外には一切の事前知識がない状態の神経網から出発した点が既存のアルファ碁プログラムと違う。碁盤を置いて「セルフ囲碁」で囲碁の道理を体得した。勝率を高める手がどんなものなのかを自ら悟り、関連データを蓄積して実力を育てた。こうした学習方式は、生物の脳で実際に作動する「強化学習」と似ている。犬に餌を与え「お座り」など特定の行動を訓練するのと似ている。

グーグルの人工知能(AI)技術開発子会社のディープマインドが、新しい囲碁プログラム“アルファ碁ゼロ”を公開した=資料:ネイチャー提供//ハンギョレ新聞社

 昨年3月の「グーグル・ディープマインド・チャレンジ」でイ・セドル九段に4対1で勝ったアルファ碁(便宜上、アルファ碁・李と表記)と比較すると、アルファ碁ゼロは独学36時間でアルファ碁・李の実力を上回った。また、72時間の独学後「イ・セドル九段対アルファ碁・李」の実戦当時と同じ対局条件(制限時間2時間ずつ)で、アルファ碁・李と対決した結果、百戦全勝を記録した。アルファ碁ゼロが一手に0.4秒かける“超速”囲碁で490万局を独自に試し研究した結果だと研究陣は説明した。

 アルファ碁ゼロが誰の助けも借りずに40日かけて2900万局を試した後には、今年5月に世界ランキング1位の柯潔九段を3対0で破ったこれまで最強のアルファ碁(アルファ碁マスター)の実力も圧倒した。アルファ碁マスターと勝負して100戦89勝11敗を記録した。

 アルファ碁ゼロは、独学する過程で人間が体得した定石を自ら悟ったのみならず、独特の定石も開発した。研究陣は独学で囲碁を習得したアルファ碁ゼロが、既存のアルファ碁より強い理由に関して「人間の知識の限界にもはや束縛されないため」と説明した。既存のアルファ碁のバージョンは、一部の定石などを人間から学び、人間が蓄積した棋譜も勉強したが、アルファ碁ゼロは人間から習ったものがないために人間の先入観と限界にしばられないということだ。

 ハサビスは「私たちの囲碁プログラムのうち、最も強力なバージョンであるアルファ碁ゼロは、人間が作ったデータを入力しなくて良いだけでなく、コンピューティングパワーもあまり必要としない。人間の限界を跳び超える人工知能研究の重要な道しるべになるだろう」と強調した。

キム・ジェソプ記者 (お問い合わせ japan@hani.co.kr )
https://www.hani.co.kr/arti/economy/it/815115.html 韓国語原文入力:2017-10-19 16:36
訳J.S(1640字)

関連記事