◇対談◇ 目の機能を人工知能で解析


左から山本副機構長、牧内副機構長、岩根社長、岩根経営企画室室長、川端機構長


株式会社 岩根研究所


  • 代表取締役 岩根和郎
  • 経営企画室室長 岩根弥生


北海道大学産学・地域協働推進機構


平成28年10月11日に、北大発認定ベンチャー企業「株式会社岩根研究所」代表取締役岩根和郎氏に「創業・技術・経営・大学との関係」について伺いました。

岩根研究所のメインの技術は、空間を3次元解析できるCV(カメラベクター)技術です。
世界トップレベルの技術を生み出す背景や、人工知能開発への思いなどをお話しいただきました。

創 業  -「目」の機能を解析し、画像から空間を-


岩根:北大の応用電子研究所には、昭和41年から12年間在籍していました。そこで工学的なアプローチで人間の視覚の情報処理の研究をやっていました。

人間の目はかなり精巧で、今は一般的にも理解されていると思うのですが、当時この研究は感動がありました。実際に我々が見ているものは「処理したあとのもの」なのですが、人間の目は「自分に都合良く組み立ててみている」ものなのです。

これを追求していくとコンピュータでも実現できるのではないか?と長年思っていました。そして北大にいたときに特許申請をしたのですが、大学に在籍したままこの研究をするのは難しい、とのことだったため、一人で大学を飛び出しました。

いま考えると無謀ですね。もし現在そういうことをしようとしている人がいたら止めますが、その時は会社設立の一年前、35歳頃のことですから若かったのですね。

川端:応電研は修士を出たのですか。

岩根:いいえ、僕は山形大学で物理を学び、その後北大の助手で入りました。

川端:テレメーターの松本悟郎先生ですか?


山本:当時は年代を超えて応電研や境界領域の物理学など様々な情報ネットワークがあり、研究所は個性を持っていました。会社を立ち上げた方も多くいましたね。

川端:その時代の中でスピンアウトされたのですね。

岩根:当時は「ベンチャー」という言葉もない頃のことです。

川端:昭和54年頃(1979年)の時代は、札幌のベンチャーが立ち上がった時代です。コンピュータとは、部屋を1か2つ使っているぐらいのイメージがある時代でした。大学やその他大企業にしかコンピュータがない時代になぜそれを自分ができるとお考えになったのかをお聞かせください。

岩根:深く考えていなかったのですよ。まず目的が先にあったので、それが大学でできないのなら自分でやるしかない、という感じで飛び出たのです。ですから最初は人を雇うお金もなく、手持ちは退職金+αぐらいでした。頭の中で考えていたことは学会ではなく特許で積み上げていきました。

川端:これはプログラミングなのですか?

岩根:それは得意な人にまかせており、僕は新発想と解析です。まずは人工知能に取り組もうと思いました。目と大脳はつながっていますから、目の機能を調べるのです。これは応電研の頃に専門としていました。

それと同じ事をコンピュータでできないかと考えると、アルゴリズムは作れますね。認識や空間を解析できる方法を試行錯誤しながらずっと取り組んでいました。そのため当初7~8年は全く収入にはつながっていませんでした。

知らないからできたのかもしれません。今なら当たり前かもしれませんが、当時は周りにそういうことをやっている人が誰もいなかったので。補助金を申請しても、担当者から「絶対ムリだ、絶対にできるはずがない。」と何度も言われましたね。

牧内:昭和54年に創業し、平成4年にビデオGISとありますね。ここで収入が発生したということになると思うのですが、それ以前の時期に行っていた特許の申請と、プログラミングを依頼するなど、人を雇うときのお金はどの様にされていたのですか。

岩根:カメラは多種多様に買い揃えていましたのでそれらを利用し、アルバイトで撮影などをしました。依頼があれば個人や国・自治体の工事の撮影を受注し、運営しながら給料を出していました。それと平行して人工知能の研究をしていました。そのころはまだ人工知能とはいえませんが、映像と地図がリンクして見えるようにしました。MS-DOSの時代です。

技 術  -3次座標、カメラベクター(CV)-


岩根:PRM(パーツリコンストラクションメソッド:Parts Reconstruction Method)とは、人間は感情や情報を、相手とどの様に通信しているのかを考察して至った考えです。

人の場合、映像を相手に送っているわけではなく、この空間を解析し、さらに対象物を認識し、部品化し、その配列から意味を作りだし、その空間を再構築するための情報を相手方に送っているのです。

たとえば、私が会社に電話して現在自分がいるこの対談の状況を伝えようとします。すると「まずイスがあり、テーブルがあり4人の人物がいる・・・」と分解して理解したことを送りますね。そういう「通信の方式」もあるだろうと考えたのです。

「映像として送るのではなく、映像を認識し、理解し送る」、どうやら人間はそのようにやっているようだ、と。そして会話もどうやらそのようにしているようだ、と。

それから外国人との会話もそうですが、お互い文化という部品の箱を持ち、その部品を交換しながら理解していく。部品化してお互いに共通、または共通じゃなくてもいいのがおもしろいのですが、ちょっと違う部品を持っていて、「この部品はこれだよね」と対応づけて「何番を送るよ」とするものです。

これを通信や記録に利用する。記録に利用しようとなると膨大なデータなので圧縮率がものすごいことになり、これは次世代の通信じゃないかと思い、人工知能と組み合わせてPRMを実現しようと思っています。


川端:落語みたいですね。言葉を伝えて状況を共有する。今、文字で言うところの「フォント」がそうですね。たとえば「何々のB」と指定すると、相手のパソコン画面上にも同じ文字が表示される。それの、もっと根源的な任意の空間ということですね。

岩根:そうです。当時は相関(マッチング)技術しかなく、照明条件を少し変えると認識できないことがあり多くの制約がありました。ところが現在では、ディープラーニングを使用すると認識率が急激に上がります。

一方で、座標を決める技術を我が社で開発しており、映像の中で3次元座標を決める。その技術が実は我が社のメインの技術となっているもので「CV(カメラベクター)」という技術です。

牧内:2つのカメラですか?

岩根:1つのカメラでも可能ですが、10個でも100個でも可能です。動画から空間を解析する技術です。空間を解析し、2次元の動画でありながら映像の任意の一部をクリックすると3次元座標(絶対座標)が表示されます。

3次元で答えてくれる、そこまでできています。カメラベクター技術(CV)で、空間を3次元解析できる技術です。

それと先ほどの認識を組み合わせると、任意の位置にある物体の座標とそれが何であるかの認識。

今、自動運転の話がありますが、道路上にある標識も何の標識であるかすべて認識できるものです。この技術は、たぶん世の中で、世界でトップレベルだと思います。普通、認識はできても座標はなかなかわからないのです。

牧内:これは車が走っていて、車の位置が完全にトラックされている。ある標識についてこの位置から見た標識と、別の位置から見た画像を1つのものとして処理すると、「カメラがたくさんある」ような処理ができるという感じですね?

岩根:そういうことです。カメラを搭載した車が走ることで標識のDB(データベース)が自動的にできていくのです。もちろん標識を認識しながら走ることもできますが、まずDBが最初にあって、それをたどって走ればいい、というのが我が社の自動運転です。

自動運転では車両そのものにお金がかかりますから、今はPOCだけは済んでいると言えるところです。自動車会社にも早くこの技術を知ってほしい、と待っているところです。

牧内:誤差はどのくらいですか?


岩根:距離の誤差は、測量精度です。国土地理院の道路管理用の地図と同様に500分の1精度です。

これは絶対精度で±15㎝です。たとえ10m先でも出せるのです。ですから、一方で我が社はこれを測量機器として販売しており、海外にも輸出しています。
このカメラは車につけてもいいし、歩いているときでも、船でもいいのです。

我が社のカメラはレーザースキャンよりも安いのですが、精度がとても良く、操作が簡単、なおかつ堅牢です。こういったものが我が社の技術であり、これを人工知能へと進めようと思っているのです。

我が社の映像から2次元の地図にすることも可能ですが、このままの3次元映像として使用してもらおうということを提案しています。映像の中でクリックするだけで絶対座標が表示され距離計測ができます。

牧内:この技術をいかに売るか、というのが大変な問題だと思うのですが、今はどの様な状況でしょうか。

岩根:官公庁の公募に応募することを検討しており、そこからさらに技術のレベルアップを図ろうと思っています。

川端:走りながら画像を撮影しながら座標を決めていく、となると速度が一定である必要はないのですか?

岩根:車の走行速度に関する仕様は「時速60㎞以内」としており、速度は任意です。自己位置がカメラの絶対座標となり、ここに情報を集約しています。

川端:2つのカメラによって座標が決まるのですか?

岩根:1つでも座標は決まります。2つ使う理由はベースのラインでスケールを決めているのです。人間の目もそうですが、2つの目でスケールを決めているのです。

相対座標だと、模型の飛行機が飛んでいるのか本物の飛行機が飛んでいるのか分からないのですが、そこで2つの目でスケールを使い、10フレーム程度を使って正確に計算しています。

実は3次元空間なのでCG合成が可能で、後から看板など、情報のタグを入れることもできます。

経 営  -苦手だからこそ、できること-


岩根:本当に僕は経営に対して苦手意識を持っている人間なのですが、経営をやる事により自分の一番苦手な事をやった、そのことが僕にとってはバランスが取れたのではないかと思います。

昔は研究開発ばかりやっていた人間でした。ところが、自分で経営をやってみると面白いし、大事なことだと思いますし、物の見方が変わりました。以前は見えていなかった世界が見えて来ます。

いいものさえ作れば売れる、と思っていたのですが、実はそうではないと言う事を実感しながらも、楽しく経営ができています。

牧内:自分が経営をやっていける、と自信を持った瞬間はありますか?

岩根:ありません。経営は苦手なのですが、世の中の方から近づいてきてくれた、という感はあります。

最初に目指した「人工知能」、それをいうと当初は馬鹿にされるほど浸透していないものでしたが、少し言葉を和らげて「自動運転」としました。現在は、やっと世の中が自動運転をやるようになってきましたね。

僕は経営としては、持ち球はストレートしかなく、何事も正面突破しかできない人間だと思っています。

牧内:その度にサポートしてくれる、助けてくれる人があらわれる、という事だったのでしょうか。

岩根:助けはお客さんの理解でしょうね。経営は「ブレないように」と進めてきました。でも、こんなに経営が苦手な人でもできるんだ、というのが一つの実感としてあります。

大学には僕みたいなタイプが多いのではないかと思うのです。ですから、そういう人たちに向けて「できるんだよ」と、言いたいです。
ただ「一つ間違うと一文無しになるよ」という事も伝えたいですね。

企画室長:普通だったら生き残れなかった場面も何度かあるのではないかと思うのですが、何がここまで生き延びてこられたのか、と思うところもありますか。

岩根:「決めたことを変えない」、「ブレない」という事が大切なのではないかと思います。今でこそ言えるようになりましたけど、MS-DOSの時代に「人工知能」、「自動運転」に取り組むためにはそういったことが大切だったのだと思っています。

川端:パソコンがやっとの時代で、まだまだ「画像処理だなんて」、という時代から経営されているのですから。

岩根:時代がやっと追いついてきてくれた、という感じです。これからは時代に追い抜かれないようにしないといけませんね。

大学との関係  -エンジニアが集まる環境-


牧内:大学との関係についてお伺いいたします。
「大学とはこんな関係を続けてきた」または「これから大学との関係をこうしたらいいのでは」など、何かありますでしょうか。

岩根:一番正直なところ学生に来てほしいと思っています。我が社の研究開発担当者の半数以上は北大出身です。ただ、一度どこかの大企業へ出て行き、戻ってきた社員もいます。

牧内:私は以前、岩根研究所へ伺った事があるのですが、円山の高台に素敵な建物が建っており、中に入ると「温室か植物園か?」と思えるような会社でした。シリコンバレーなどにそういった雰囲気のところがあるとは聞いていましたが、「札幌にもあったのか」と、その時思いました。

これらの「立地環境」もエンジニアを集める要素、またはある種の「経営」ではないかと思います。

岩根:僕が研究室にいたものですから、そういった雰囲気を残したいという思いがあります。「成果を急いで」とは言わず「研究に適した環境を」と思っています。

ですが納品の時はそうは言っていられないですね。
今、開発者13名ほどが勤務しており「出退社自由」です。

いつ来ていつ帰ってもいいと言っていたのですが、いざ「会議をやるぞ」となった時に誰もいなかったことがあったため「午後二時には全員必ずいるように」というように会議時刻だけは決めています。

牧内:開発は他の大学と行ったことはありますか?

岩根:これまでにはありません。ですが、本当は北大の先生とご一緒に共同研究ができればと思っています。

山本:タイにも事務所がありますね。これは現地での大きな仕事があるため設置されたのですか?

岩根:これはもともとタイでも開発の仕事をしようと思い、開発部隊を運営しようと思っていたのですが、今は営業拠点として運営しています。タイの道路間の空間解析などの道路管理が主です。

技術としての精度についてご説明しますと、その気になれば3次元空間の精度はミリ単位で実現できる技術があります。

川端:釘が打てるほどの正確さですね。

岩根:一方でどうしても人工知能まで行きたいと思っているのです。そのためには多くの学生が我が社に入ってくれることを願っています。

進めている技術には「基礎学力があればできる」ということが分かりましたので、「どんな応用技術を学んだか」と言う事よりも、とにかく「基礎をきちんと学ぶこと」が重要です。

基礎学力さえあれば僕たちが何とでも教える事もできますし、彼らもやってくれるという、そういう印象があります。
牧内:最後に現代の若い創業者へのメッセージをお願いいたします。

岩根:「リスクを恐れない事」ですね。何かあっても「裸」になる覚悟で、ブレない、という事、それしかないのではないか思います。

人工知能は、リアルな世界で動くものだけではなく、バーチャルな地球を作り、そこで人口知能を動かして色々な実験ができるので大きな社会実験場になる、と思っています。

ネットワークを組み、複数の同時社会、デジタルパラレルワールドのシミュレーションをやってみたいと思っています。

川端:人工知能も、素早いものやそうでもないものがあると思うのですが、そのような人工知能を集めて多様な社会ができるのでしょうか。単一のものだけで運用する事はどうか、と。

岩根:そのとおり、実は人工知能の開発は恐ろしいものです。核兵器の開発にも匹敵すると思います。ですから開発には、それが恐ろしいことの究極に向かわないようなコンセプトが非常に大事です。

そしてそこには、僕には譲れない部分があるので「常にそこに自分も関わっていたい」と、そう思っています。


北海道大学 TLO通信 創業デスク 北海道大学研究シーズ集 vol.4
食科学プラットフォーム 北海道大学URAステーション 北海道大学 研究者総覧 onちゃん北大事務局