「グーグルに学ぶディ―プラーニング」

グーグルに学ぶディ―プラーニング」日経ビッグデータ[編]を読みました。グーグル社員へのインタビューおよびグーグルアプリの利用事例を通して、ディ―プラーニングを数式を使用せず平易に解説するとともに応用事例をわかりやすく解説してくれています。

グーグル社は「AI(人工知能)ファースト」の経営方針を打ち出し、モバイルファーストの世界からAIファーストの世界へ移行していくことを宣言しています。また、グーグル社はグーグルクラウドプラットフォームを通してディ―プラーニングに関する研究成果を一般に公開しています。このプラットファームを利用すると、利用者は既にグーグルで学習を行った(構築した)モデルをAPI(アプリケーション・プログラミング・インターフェース)を通して使用することができます。また、利用者が自分でモデルを構築したい場合は機械学習ライブラリであるテンソルフローを使用することができます。

本書を読んで最も印象的であったのは、グーグルクラウド・マシンラーニング・グループ研究責任者のジア・リーさんのインタビューです。彼女によるとディ―プラーニングは「データハングリー」であり、大量のデータがある場合には威力を発揮するが、人間のように限られた情報から学習していくことが残された課題であると指摘していいます。確かに人間は数少ない事実とあいまいな多くの情報を基に次の一手を打つ場面が多々あり、見事に成功をおさめる人もおられます。本書に示されたエアロセンス社のドローン空撮データへの活用事例は示唆に富みます。彼らは既存の学習モデルを使って、異なる課題を学習させる転用学習を利用することで、数少ないデータで目的の課題に対して良好なモデルを構築しています。

ディ―プラーニングは音声認識、画像認識、自然言語処理とその適応範囲が急速に広がってきており、今後、ますます我々の身近な存在になるのでしょう。

「IBM奇跡の”ワトソン”プロジェクト」

「IBM奇跡の”ワトソン”プロジェクト」スティ―ヴン・ベイカー著 土屋政雄訳 金山博・武田浩一解説 を読みました。ワトソンプロジェクト発足から、2011年2月16日にクイズ番組「ジョパティ」でブラッド・ラターおよびジェニングズと対戦し、勝利するまでのワトソンの成長が読みやすくまとめられています。

人口知能の分野では理想主義と実用主義的な立場で研究が行われているようで、実用主義のワトソンは理想主義者からは厳しいコメントをいただいているようである。例えばワトソンは所詮統計分析マシンで理論を作れない。ワトソンは低能すぎ、無知すぎ、有名すぎ、金満すぎる。ただ、実用的な観点からワトソンは「ジョパティ」で強いと言う能力があります。

私には検索エンジンとワトソンの差異がよくわからなかったのですが、本書を読んでよく理解できました。具体的な答えを求める単純な質問(日本で一番高い山は)に対しては両者には大差はないのですが、このような質問は「ジョパティ」では30%程度出題されるだけで、残りはもっと骨のある質問のようです。このような質問に対して答えの信頼度を的確に示すのがワトソンのようです。検索エンジンでは統計的に最も見込みのあるウェブページにユーザーを案内し、答え探しはユーザーに任せることになります。

「ジョパティ」専用マシンとして開発されたワトソンですが、今後の理想的な展開としては、人間の代わりに文書を読み、理解し、何が書かれているかを教えてくれ、内容に関して人間からの質問に対して回答してくれることだと思います。近い将来の利用分野はコールセンターが有望視されているようです。また、製薬研究所の頭の良い研究助手、法律事務所が理想の職場と言うアイデアもあるようです。いろいろな産業に溶け込んでいければ大成功だと思います。

「初めてのWatson」

最近、IBM Watsonが活躍している様子がマスコミ等で取り上げられています。

三菱商事、IBM 「ワトソン」を導入―AIが社員の問い合わせに応答(2016年11月24日 日経産業)

GM、車載情報端末にIBMの人工知能「ワトソン」(2016年10月26日 ウォールストリートジャーナル)

Watsonでどのようなことができるのか興味があり、「初めてのWatson」井上研一「著」を読みました。本書は実例を交えてWatson APIの使い方を紹介したわかりやすい入門書です。Watsonは元々米国のクイズ番組「Jeopardy!(ジャバディ!)」での勝利を目標にIBMにより開発された質問応答システムでしたが、2011年に歴代のチャンピオンを破り、その後はクイズ専用Watsonの要素技術がAPI(Watson API)形にばらされ、利用者に提供されています。利用者は自分の課題に適した形でAPIを組み合わせて使用することができます。APIとしては①Speach To Text(音声認識サービス)、②Natural Language Classifier(テキスト分類サービス)、③Retrive and Rank(回答を準備するAPI)、④Document Conversion(Watsonが判読可能なフォーマットへの文書変換サービス)、⑤Conversation(ユーザーとの会話を行うサービス)、⑥Text to Speach、⑦Visual Recognition(画像認識サービス)等々があります。APIは現在もIBMにより鋭意拡充中のようです。APIを利用したWatson以外にも、Watson IoT, Watson Analytics, Watson Explorer等のWatsonがあるようです。

もしも私がWatson APIを使うとすれば、Visual Recognitionを使って、野外で見つけた昆虫をスマホで撮影して送信すれば、その名前と関連情報が得られるサービスの立ち上げに使ってみたいと思います。また、昆虫の飼育に関するFAQ(よくある質問)を取集してNatural Language ClassifierおよびRetrive and Rankを用いて質問応答システムを作ってみたいと思います。