AI First時代の意味

旧GoogleがAlphabetというホールディングカンパニーになり、スリムダウンされた現GoogleにSundar Pichai CEOが就任したのが2015年10月。それから間もなく、Sundar Pichai CEOのもと、Googleは従来のMobile First から「AI First」を成長戦略として掲げてきました (Source)

「AI First」が何を意味するのかいまいち分かりにくかったのですが、年末に読んだNew York Timesの「The Great A.I. Awakening」という記事を読んで少し理解が深まりました。

The Great A.I Awakening – The New York Times (2016/12/14)

素晴らしい記事なので是非目を通していただきたいですが、ざっくりした内容はGoogle Translate(Google 翻訳)をAI(ニューラル機械翻訳)で作り変えたら劇的に改善しました、というものです。Google Translateは、100以上の言語に対応し、月間5億ユーザーが利用し、毎日1400億単語が翻訳される巨大なプロダクトです。2006年から10年かけて改善を重ね続けてきましたが、このたびニューラル機械翻訳(GNMT)に作り変えたところ、翻訳精度がいきなり約55-85%も改善したようです。(Source)

試しに、新しくなったGoogle Translateを使ってNYT記事の冒頭の文を翻訳してみました。

NYT記事(Source)

“Late one Friday night in early November, Jun Rekimoto, a distinguished professor of human-computer interaction at the University of Tokyo, was online preparing for a lecture when he began to notice some peculiar posts rolling in on social media..”

Weblio翻訳 (Source)

“11月上旬にある金曜日の夜遅れて、6月に、彼が若干の独特なポストがソーシャルメディアで入っているのに気がつき始めたとき、レキモト(東京大学の人間のコンピュータ・インタラクションの優秀な教授)は講義に備えてオンラインにいました。”

Google Translate翻訳 (Source)

“11月初旬の金曜夜遅く、東京大学で人間とコンピュータのインタラクションを担当する著名な准教授のレキモト氏は、ソーシャルメディアに巻き込まれた独特な記事に気付き始めたときにオンラインで講義を準備していました。”

多少変なところは残っていますが、だいぶ分かりやすくなったのではないでしょうか。

 

たった9か月でニューラル機械翻訳へ

本記事で興味深かったのが、Google Translateほどの巨大なプロダクトでも、ニューラル機械翻訳に作り変えるのに、たった9か月しか要しなかったことです。

主体となったGoogle BrainとGoogle Translateのチームが意気投合したのが2016年2月。すぐに実験したところ結果良好だったため、3月中旬にはGoogle Translateをニューラル機械翻訳化を決断。4月には約30名の混成チームを組成し、9月には英語⇔中国語を先行して一部ユーザーにリリース。そして、2016年11月には日本語を含む11言語をニューラル機械翻訳で一般公開し、2017年末までには100以上の言語に適用(予定)。圧倒的なスピード感です。

もちろん、Google Brain内において今までの研究の蓄積があってこそのスピード感でしょう。Google Brainは、2011年に伝説的エンジニアのJeff Deanと当時スタンフォード教授だったAndrew Ngが出会って生まれたプロジェクトで、2012年にAndrew NgがBaiduに引き抜かれてからは、トロント大学のGeoffrey Hinton教授のもとでチーム拡張してきました。有名なGoogle Catを発表したのもこのチームです。2014年にDeep Mindを買収してからは、(組織としては独立していますが)人材交流やナレッジ共有しながら研究開発をしているようです。(Source)

また、Googleが有するTensorFlow(機械学習ライブラリ)とTPU(TensorFlow専用チップ)を活用できたこともスピード開発に貢献したと思います。TensorFlowは2015年9月にオープンソース化され、Googleが独自に開発したTPUも2016年5月には存在が明らかにされました。特にTPUによって、処理能力を劇的に改善できたとされ、Jeff DeanによるとTPU無しでは実現できなかったとされています。(Source)

(Credit: Google)

全エンジニアを機械学習ニンジャへ

Google Translateの成功もあって、Googleは多くのプロダクトを機械学習ベースにすると宣言しています。一方、Googleですら、機械学習を理解し実装できるエンジニア数には限りがあるため、外部からの採用(初任給が1億円を超えることも。。。)、と社内研修を強化しています(Source)

特に社内研修は興味深く、2015年から「Machine Learning Ninja」と呼ばれる6か月間の研修プログラムを提供しています(Source)。こちらは、希望するエンジニアに対して (おそらく厳しい選考があるのでしょうが)、座学とメンタリングとプロジェクトを通じて機械学習を実装できるように教育するものです。Jeff Deanは、25,000人いるとされるGoogleエンジニアの全員を、いずれは機械学習実装できるようにしたいと言っています(Source)

 

AI First時代において

Sundar Pichai CEOは「AI First」を戦略に掲げ、AI(機械学習)に必要なデータ、アルゴリズム、処理能力、人材の全てに投資しています(Source)。「AI First」戦略のもと、Google Translateでの成功をGoogle Searchを含む他プロダクトへも展開していくでしょうし、TensorFlow、Google Cloud Platformにみられるように機械学習インフラの外部提供も加速していくでしょう。

この流れはGoogleに限ったことではなく、Amazon (AWS)、Microsoft (Azure)、 IBM (Watson), Baidu (Baidu Cloud) がこぞって機械学習インフラの外部提供を始めています(Source) その結果、スタートアップ・大企業に限らず、多くの業界の業務が機械学習ベースで組み換えられ、省力化 ・自動化・最適化されるようになるでしょう。

このような時代のおいては、アルゴリズムや処理能力はクラウドから提供されますので、データと人材を有しているかが差別化ポイントになると思います。

データに関しては、独自データを持っていればベストですし、公開データを加工するノウハウも優位性になると思います。例えば、ビッグデータを機械学習させて企業・個人の与信審査を行うフィンテックサービスが世界各地で生まれていますが、これはクラウド会計ベンチャーのように独自にアクセスできるデータを持てれば強いと思いますし、独自データが無くても取引先情報、会社所在地、Amazon評価、SNS情報、経営者経歴、 メディア掲載情報等、どんなデータを組み合わせて加工すれば正しい与信ができるのかのノウハウも優位性になると思います。

また、人材に関しては、機械学習を実装できる人材の確保が重要になると思います。(私の理解では)機械学習で求められる統計や数学のレベルは、天才でなくても勉強で習得できる範囲にあります。外部から採用しようにも、アメリカでも日本でもまだ専門人材が不足している状態であるため、社内育成するか、育成機関を立ち上げる必要がありそうです。

一方、機械学習は今までのオペレーションを改善することには役立ちますが、何か全く新しいものを生み出すものではないと理解しています。ビッグデータへのアクセス、さらには機械学習による業務改善効果を考えると、ある程度の規模のオペレーションを持っていないと全く意味がありません。だからこそ、大企業(オペレーション)とスタートアップ(機械学習)の提携は今後増えると思いますし、テクノロジー企業の非ネット業界への浸透も進むと考えています。

AI First時代において、機械学習の影響から逃れられる業界はもはや無く、それを活用できるか否かが企業の命運を分けることになるでしょうし、アメリカ西海岸から起きたその波は既に日本にも到達し始めています。

繰り返しになりますが、本当に良い記事なのでご興味ある方は是非読んでみて下さい。(それこそGoogle Translate使ってでも!w)

The Great A.I Awakening – The New York Times (2016/12/14)

(Credit: New York Times Magazine)