工学部電気電子・情報工学科 情報コース
教授加藤 邦人
画像を認識して理解するAIの進歩
AI=脳、画像認識=眼
私の研究分野は“コンピュータビジョン”という分野で、広く言えば画像認識です。
現在、コンピュータビジョンと言うと、多くの方々にAIの主要な研究分野として思われていますが、実は私達研究者の間ではAIの捉え方が少し違っている為、当初はコンピュータビジョン=AIという考え方に対して少し抵抗がありました。
何故かと言うと、AIは日本語では”人工知能”と言い、知能すなわち“脳”であると私達は考えていて、画像処理や画像認識は見えているモノを表す為、すなわち“眼”であると考えていたからです。しかし、AIの進歩により、現在のコンピュータビジョンと言う言葉の中には、画像を認識するという事にプラスして、「画像を認識して“理解する”」という意味合いが込められるようになりました。理解するのは“脳”の仕事ですので、コンピュータビジョンはAIと言っても過言ではないですね。
以後、それに伴って、私達研究者自身も「コンピュータビジョン=AI」と認識するようになり、それどころか今ではすっかりコンピュータビジョンはAIを代表する研究分野になっています。
世界を変えたディープラーニング
第3次AIブームを迎えて、深層学習すなわち「ディープラーニング」が脚光を浴びていますが、このディープラーニングというAIの学習方法が多くの方に認識されるキッカケは、まさにコンピュータビジョンからだったと言っても過言ではありません。何故ならディープラーニングでAIが学習した結果が、“画像”という見てわかる形で現れる為、人に訴えかけ易いという点があげられます。
現在、スマホの写真などをAIが顔識別やモノ識別してくれる作業が当たり前の時代になりましたが、実はこの作業、ディープラーニングが登場するまでは画像認識分野においては大変難しい技術でした。しかし、ディープラーニングが登場する2012年を堺に、ディープラーニングの技術はどんどん進歩して性能も格段に上がり、現在では、未来の技術と思われていたような画像の認識を行えるようになったのです。これにはかなり驚かされました。その結果、2015年ぐらいから本格的なディープラーニングブームが始まった事で、私自身の今までしていた研究のやり方は全部放棄せざるを得なくなってしまったのです。以前と同じやり方の研究では、ディープラーニングには到底勝つ事が出来ないと悟らせられました。以前と同じやり方ではもう歯がたたないのです。もうこの流れが止まる事はないでしょう。
ディープラーニングは、たった数年という短い期間で、それまでの私の研究を、そして世界を大きく変えてしまいました。ディープラーニングの登場はまさにAIがもたらした“革命”なのです。
ディープラーニングにおける日本の遅れ
日々、飛躍的進化を遂げるディープラーニング。コンピュータビジョンの研究では、アメリカなど世界の主要な多くの国の研究者が100%ディープラーニングに切り替えていると思うのですが、実は日本ではその切り替えの比率が半分程度と非常に低く、技術大国日本と言いながら、世界と比べると相当に遅れをとっているのが残念ながら今の正しい現状です。その主な要因は大きく分けて2つあると考えます。
一つは、日本の研究者側の問題です。AIがもたらした技術革命のスピードに、日本の研究者がついていけていないという事実。スピードについていくことを諦めている方も多く見受けます。技術革新に貪欲で、政府主導で研究を推進する中国や香港、シンガポールは技術革新の面において圧倒的に強くなってきています。日本も意識を切り替えないと、あっという間に追い越されてしまいます。
もう一つの要因は英語という“言葉の壁”です。
日本人の英語嫌いは今に始まったことではないですが、最新情報はやはり全て英語です。日本の学生は何しろ英語の論文を読むのが苦手です。できれば読みたくない。誰かが日本語に翻訳してくれるのを待っている。それでは、世界に追いつけないし、追い越せません。世界におけるディープラーニングの技術革新は、日本人が知らないところで大きく飛躍しているのです。日本語でその技術を知れるようになる頃には、世界はもうすでに次のステージに行ってしまっているのです。学生にはGoogle翻訳でもいいので、何しろ英語の論文を探すように強く言っています。日本語の論文は周回遅れどころか、2、3周遅れです。
これからの研究で大切な事
ネットやAIが普及する以前、最新の研究の情報は「論文誌」で、一つの論文を世に出すのには、査読や校正の作業が必要で最低でも一年はかかっていました。すなわち新しいアイデアを知るのは、その人が思いついてから1年後なわけです。また、国際会議などは半年ほどのスパンの為、速報を得る場としての役割を担っていました。しかし、その流れはネットやAIの登場で過去のものとなり、現在では国際会議で発表した段階でその研究はすでに認知済みで、その次の研究結果が出ているほど、新しい理論の認知のスピードは速くなっています。最新の研究は、アイデアの段階でarXivに投稿され、ソースはGitHubで公開されます。最新情報はSNSを通じて即座に世界に拡散します。これら最新情報を、多方面にアンテナを張って確実に捕まえる事が必要です。
特に、コンピュータビジョンの世界では、この流れが顕著です。このネット上でやり取りされる情報のスピード感についていくことが重要なわけですが、これは今のインターネットに子供の頃から接している若い世代の方が自然に最新情報を得られるようです。研究の論文をすぐに公開し、閲覧出来る仕組みが整った為、最新情報はネットの世界に溢れているので、多くの情報から良い情報を選別する能力も必要です。
1年前の情報が陳腐化してしまう現代の研究現場において、スピードや情報の鮮度というは非常に大事な事ではありますが、そこだけに囚われては、なかなか新しい発見には繋がりません。
陳腐化してしまった過去の研究と、新しいアイデアを融合して新しい何かを作り出す事が出来るのです。
私達の今まで培ってきた技術や経験値と、若い人達が持つ新しい情報とアイデアを繋げて、次の未来をより良いものにしていく研究や教育が今後は大事だと考えています。時代のスピードに怯む事なく、諦めず挑戦しつづけたいですね。きっと面白い世界が待っています。