AI First時代の意味

旧GoogleがAlphabetというホールディングカンパニーになり、スリムダウンされた現GoogleにSundar Pichai CEOが就任したのが2015年10月。それから間もなく、Sundar Pichai CEOのもと、Googleは従来のMobile First から「AI First」を成長戦略として掲げてきました (Source)

「AI First」が何を意味するのかいまいち分かりにくかったのですが、年末に読んだNew York Timesの「The Great A.I. Awakening」という記事を読んで少し理解が深まりました。

The Great A.I Awakening – The New York Times (2016/12/14)

素晴らしい記事なので是非目を通していただきたいですが、ざっくりした内容はGoogle Translate(Google 翻訳)をAI(ニューラル機械翻訳)で作り変えたら劇的に改善しました、というものです。Google Translateは、100以上の言語に対応し、月間5億ユーザーが利用し、毎日1400億単語が翻訳される巨大なプロダクトです。2006年から10年かけて改善を重ね続けてきましたが、このたびニューラル機械翻訳(GNMT)に作り変えたところ、翻訳精度がいきなり約55-85%も改善したようです。(Source)

試しに、新しくなったGoogle Translateを使ってNYT記事の冒頭の文を翻訳してみました。

NYT記事(Source)

“Late one Friday night in early November, Jun Rekimoto, a distinguished professor of human-computer interaction at the University of Tokyo, was online preparing for a lecture when he began to notice some peculiar posts rolling in on social media..”

Weblio翻訳 (Source)

“11月上旬にある金曜日の夜遅れて、6月に、彼が若干の独特なポストがソーシャルメディアで入っているのに気がつき始めたとき、レキモト(東京大学の人間のコンピュータ・インタラクションの優秀な教授)は講義に備えてオンラインにいました。”

Google Translate翻訳 (Source)

“11月初旬の金曜夜遅く、東京大学で人間とコンピュータのインタラクションを担当する著名な准教授のレキモト氏は、ソーシャルメディアに巻き込まれた独特な記事に気付き始めたときにオンラインで講義を準備していました。”

多少変なところは残っていますが、だいぶ分かりやすくなったのではないでしょうか。

 

たった9か月でニューラル機械翻訳へ

本記事で興味深かったのが、Google Translateほどの巨大なプロダクトでも、ニューラル機械翻訳に作り変えるのに、たった9か月しか要しなかったことです。

主体となったGoogle BrainとGoogle Translateのチームが意気投合したのが2016年2月。すぐに実験したところ結果良好だったため、3月中旬にはGoogle Translateをニューラル機械翻訳化を決断。4月には約30名の混成チームを組成し、9月には英語⇔中国語を先行して一部ユーザーにリリース。そして、2016年11月には日本語を含む11言語をニューラル機械翻訳で一般公開し、2017年末までには100以上の言語に適用(予定)。圧倒的なスピード感です。

もちろん、Google Brain内において今までの研究の蓄積があってこそのスピード感でしょう。Google Brainは、2011年に伝説的エンジニアのJeff Deanと当時スタンフォード教授だったAndrew Ngが出会って生まれたプロジェクトで、2012年にAndrew NgがBaiduに引き抜かれてからは、トロント大学のGeoffrey Hinton教授のもとでチーム拡張してきました。有名なGoogle Catを発表したのもこのチームです。2014年にDeep Mindを買収してからは、(組織としては独立していますが)人材交流やナレッジ共有しながら研究開発をしているようです。(Source)

また、Googleが有するTensorFlow(機械学習ライブラリ)とTPU(TensorFlow専用チップ)を活用できたこともスピード開発に貢献したと思います。TensorFlowは2015年9月にオープンソース化され、Googleが独自に開発したTPUも2016年5月には存在が明らかにされました。特にTPUによって、処理能力を劇的に改善できたとされ、Jeff DeanによるとTPU無しでは実現できなかったとされています。(Source)

(Credit: Google)

全エンジニアを機械学習ニンジャへ

Google Translateの成功もあって、Googleは多くのプロダクトを機械学習ベースにすると宣言しています。一方、Googleですら、機械学習を理解し実装できるエンジニア数には限りがあるため、外部からの採用(初任給が1億円を超えることも。。。)、と社内研修を強化しています(Source)

特に社内研修は興味深く、2015年から「Machine Learning Ninja」と呼ばれる6か月間の研修プログラムを提供しています(Source)。こちらは、希望するエンジニアに対して (おそらく厳しい選考があるのでしょうが)、座学とメンタリングとプロジェクトを通じて機械学習を実装できるように教育するものです。Jeff Deanは、25,000人いるとされるGoogleエンジニアの全員を、いずれは機械学習実装できるようにしたいと言っています(Source)

 

AI First時代において

Sundar Pichai CEOは「AI First」を戦略に掲げ、AI(機械学習)に必要なデータ、アルゴリズム、処理能力、人材の全てに投資しています(Source)。「AI First」戦略のもと、Google Translateでの成功をGoogle Searchを含む他プロダクトへも展開していくでしょうし、TensorFlow、Google Cloud Platformにみられるように機械学習インフラの外部提供も加速していくでしょう。

この流れはGoogleに限ったことではなく、Amazon (AWS)、Microsoft (Azure)、 IBM (Watson), Baidu (Baidu Cloud) がこぞって機械学習インフラの外部提供を始めています(Source) その結果、スタートアップ・大企業に限らず、多くの業界の業務が機械学習ベースで組み換えられ、省力化 ・自動化・最適化されるようになるでしょう。

このような時代のおいては、アルゴリズムや処理能力はクラウドから提供されますので、データと人材を有しているかが差別化ポイントになると思います。

データに関しては、独自データを持っていればベストですし、公開データを加工するノウハウも優位性になると思います。例えば、ビッグデータを機械学習させて企業・個人の与信審査を行うフィンテックサービスが世界各地で生まれていますが、これはクラウド会計ベンチャーのように独自にアクセスできるデータを持てれば強いと思いますし、独自データが無くても取引先情報、会社所在地、Amazon評価、SNS情報、経営者経歴、 メディア掲載情報等、どんなデータを組み合わせて加工すれば正しい与信ができるのかのノウハウも優位性になると思います。

また、人材に関しては、機械学習を実装できる人材の確保が重要になると思います。(私の理解では)機械学習で求められる統計や数学のレベルは、天才でなくても勉強で習得できる範囲にあります。外部から採用しようにも、アメリカでも日本でもまだ専門人材が不足している状態であるため、社内育成するか、育成機関を立ち上げる必要がありそうです。

一方、機械学習は今までのオペレーションを改善することには役立ちますが、何か全く新しいものを生み出すものではないと理解しています。ビッグデータへのアクセス、さらには機械学習による業務改善効果を考えると、ある程度の規模のオペレーションを持っていないと全く意味がありません。だからこそ、大企業(オペレーション)とスタートアップ(機械学習)の提携は今後増えると思いますし、テクノロジー企業の非ネット業界への浸透も進むと考えています。

AI First時代において、機械学習の影響から逃れられる業界はもはや無く、それを活用できるか否かが企業の命運を分けることになるでしょうし、アメリカ西海岸から起きたその波は既に日本にも到達し始めています。

繰り返しになりますが、本当に良い記事なのでご興味ある方は是非読んでみて下さい。(それこそGoogle Translate使ってでも!w)

The Great A.I Awakening – The New York Times (2016/12/14)

(Credit: New York Times Magazine)

テクノロジー進化の行く末

テクロノジーは日々進化していっていますが、このまま進むとどんな未来が待っているのでしょうか?

最近、こんなことをよく考える(妄想する?)のですが、この巨大でざっくりとした疑問に真っ向から向かう面白い本に出会いました。The Second Machine Age2人のMIT教授(Erik Brynjolfsson、Andrew McAfee)の共著である「The Second Machine Age」で、アメリカでは2014年のテクロノジー系ベストセラーにもなっています。何故か和訳版は未発売のようですが…

The Second Machine Ageの要約

非常に中身の濃い本をサマリーするのは難しいのですが、ご参考までに個人的に印象的だったポイントを纏めます。

  • 人類の歴史を振り返ると、約1万年にわたって人類の開発指数(Human Development Index)はほぼフラットだった。しかし、1775年に蒸気機関が発明され、爆発的な成長を遂げた。これは、今まで人間に頼ってきていた「動力」を蒸気機関が担うようになり、工場の巨大な機械を動かし、蒸気機関車を走らせ、電気を使うようになったからである。「動力」の飛躍的向上が、あらゆる周辺テクノロジーを押し上げ、人類の生産性を飛躍的に向上させた。(第1の機械の時代 – The First Machine Age)
  • 現在は、同様の変化が「知力」に起きようとしている(第2の機械の時代 – The Second Machine Age)。コンピューターの能力は、ムーアの法則に基づいて向上し続けている。コンピューターは、与えられたロジックに基づいて計算するのみならず、Google CarやIBM Watsonに見られるように、自らパターン認識し、機械学習して、最適解を判断する段階まできている。この進化のペースは指数関数的で、2045年前後にはコンピューターの能力は人間の脳を超えるという試算も出ている(「シンギュラリティ」)。
  • 機械の指数関数的な進化は、プロセッサに留まらず、メモリー、センサー、カメラなど多岐に及ぶ。例えば、Google Carの自動運転の肝となるLIDAR(空間測定技術)は、2000年では1台35億円したものが、2013年には800万円になり、数年後には数万円になると予想されている。継続的な性能向上とコストダウンにより、AIやロボットはより身近なものになる。
  • あらゆるものがデジタルに置き換わることで、普及コストが限り無くゼロになるため、少しでも優れたプロダクトによる勝者総取りが加速する。コンテンツの1回あたりの配信力を例にとると、吟遊詩人ホメーロスの詩は数十人、シェークスピアの劇は数百人、ベストセラー作家の本は数千万人へとリーチしてきたのに対し、現代のユーチューバーに至っては10億人にリーチできるようなっており、同一コンテンツがあらゆるところで消費されるようになってきている。社会的には、勝者総取りの加速は貧富の差の拡大に繋がる。
  • 知力をコンピューターに依存するようになったとき、人間の存在意義(≒雇用)は現状と大きく変わらざるを得ない。肉体労働については、定型業務(ルーチンワーク)はすでに機械に置き換わりつつあり(例:ロボットにより生産されるテスラ工場 )、不定型業務(イレギュラーワーク)についても、今後置き換わっていく(例:プログラミングではなく人間同様トレーニングできるロボット )。知的労働については、定型業務(ルーチンワーク)は今後機械に置き換わる(例:感情まで読み取るカスタマーサービスAI)。最後まで残るのは、知的な不定型業務であり、クリエイティブワークなどがこれに当たる。
  • 結局は、機械の進化と戦う(race against the machine)のではなく、それを上手く活用できる(race with the machine)ように人間の役割を変えれば良い。人類はテクノロジーのもたらす社会環境の変化に順応してきた歴史があり、AIやロボットを始めとする機械の進化と普及にも順応できるだろう。将来的には、定型業務は全て機械に依存し、人間はその恩恵を享受しながら、高付加価値な知的な不定型業務にフォーカスするようになる。AI

AI研究は人類存続に関わる注目されるべきテーマ

「The Second Machine Age」はテクロノジー進化のもたらす未来について非常にポジティブな見解を持っていました。一言でいうと、機械の進化を上手く活用することで人類はより豊かになる、と。

私も短中期的にはそう思っています。自動運転で交通事故が減少し、食物工場で食糧危機が解決し、バイオ医療で難病が完治し、バーチャルリアリティで物理的な制約から解放されると信じています。また、今までイノベーションは人間の知性に頼っていましたが、人間の脳ミソを超える性能を持ったAIを活用することで、イノベーションの量・質・スピードも劇的に改善するはずです。人間はクリエイティブな仕事に集中することができ、文化的にも豊かになるのだと思っています。

しかし、長期的には(シンギュラリティ以降)、もっと慎重な見方をしています。知性は、ひ弱な人類が地球の支配者になれた最大の武器であり、知性をコンピューターに凌駕されることはその支配権を渡すことに繋がると思うからです。例えば、AIに対して「人類を傷つけてはならない」と命令するのは簡単ですが、人間の知性を超えたAIがそれをどのように理解し、対処するかは想像することができません。SFチックな妄想をすると、「人類が傷つかないためには永久冷凍保存するのが最適だ」と判断するかもしれませんし、「一瞬で人類を消滅させることが、長期的に傷を最小化する」と判断するかもしれません。AIがどのように判断するかを予見するのは不可能であり(それがシンギュラリティの定義なので)、人類の想像を遥かに超える事態が起こったときのリセット方法もありません

私はAIの制御方法を究明せずしてAIがシンギュラリティに近づくことが最大のリスクだと思います。一方で、ここに対するソリューションが見つかりさえすれば、人類はAIの持つ知性を活かして桁違いに豊かになると思います。そのような観点を踏まえると、30年後に迎えるかもしれないシンギュラリティについて、AI研究者だけでなく、全ての人が関心を持ちウォッチしていくべきかもしれません。

The Second Machine Age アマゾンリンク(英語版): http://www.amazon.com/The-Second-Machine-Age-Technologies/dp/0393239357

earth