研究者紹介

【情報通信】 (2013/09/19公開)

◇長谷山 美紀 教授 大学院情報科学研究科

次世代のマルチメディアシステムの実現に向けて

子供の頃から何事にも興味をもっていた事が、研究者への足がかりに


 小学生の頃は、昆虫が大好きで、捕まえて図鑑で名前を調べたり飼ったりしました。昆虫の後は、天体に興味を持ち、天文学者になろうと思いました。中学生になって、英語を学び始めて、翻訳家になりたいと思いました。このように、様々なものに興味を持っていたことが現在の研究者になる原点であったと考えています。
 また、その頃に、私が現在の研究分野を選択した具体的なきっかけがありました。小学校の算数の教科書の『奇数の和が整数の二乗になることを証明せよ』と言う演習問題です。問題には、ヒントが付いていたので答えを導くことはできましたが、解答に納得することができませんでした。私は、「なぜだろう?」を残したままで小学校を卒業し、納得できなかった事も忘れて、中学校を過ごしました。その後、突然に、私の「なぜだろう?」が解決することになります。私は、高校の数学で納得できる説明に出会うことができたのです。その時の驚きと感動を今でも覚えています。その演習問題が、学ぶことの楽しさと知ることの喜びを教えてくれて、私は工学の研究者を目指すことになりました。もともと数学が好きだったので、理学の分野に進むことも考えていましたが、数学を道具として使って「モノをつくる」ことができる工学に興味を持ち、電子工学科へ進みました。当時、電子工学の分野はコンピュータの発達とともに飛躍的に発展し、新しい概念・理論・技術が次々と誕生していました。私自身も、誰も見たことがないものを自分の手で創り出し、それを世界に発信できることに大きなやりがいと楽しさを感じ、迷うことなく研究者の道を選びました。

次世代のマルチメディアシステムの実現に向けて


 画像や映像を人間のように理解する次世代のマルチメディアシステムの実現を目指しています。高速インターネット網が拡大し、大容量蓄積メディアが普及した現在、私たちの周りには画像や映像等のディジタルデータが溢れています。私たちの大切な情報を保存するために、必要な情報を自動で探し出す科学技術が必要です。私が目指している『画像や映像を人間のように理解するシステムの実現』は、そのような科学技術の創出のために行っています。

図1 連想型画像検索システム (Image Vortex)

図2 俯瞰型画像検索システム
画像検索システムImage Vortexは実用化され、Image Cruiserとして利用されています。
 『画像や映像を人間のように理解するシステム』を実現するためには、人間の視覚特性や聴覚特性を基盤とした認識手法や映像に含まれる音楽や音声信号の解析、さらには復元手法や次世代符号化方式等、様々な手法を構築する必要があります。また、このような手法の構築と並行して、人間が外界から得る画像や映像、音声等あらゆる信号から、どのようにして知識を得るかを解明する必要があります。そこで、マルチメディア信号処理の研究の立場から人間の知識獲得のプロセスを解明しています。
 例えば、6年前に開発した画像検索システム(図1および図2)は、人間がどのようにして望む画像を手に入れるかを考えたものです。一般の画像検索システムは、キーワードを入力して検索しますが、このシステムは、そのようなキーワードを必要としません。システムは予め各画像にその特徴を表す数字のタグを自動で付与し、ユーザが検索を始めると、画像同士が「コミュニケーション」しているかのように動き出します。画像に付与された数字のタグに基づき、類似しているものは近くに、異なるものは遠くに配置されて行きます。動いている大量の画像に人間が向き合うことで、自分自身に内在する知識や記憶が呼び覚まされて、今まで気づかなかった画像の関連性に気づき、本当に欲しい画像を手に入れることができます。また、画像だけでなく、映像についてもキーワードを使わず感覚的に探せる連想型映像検索エンジン (図3)を開発し、音楽、静止画像、映像を個人の好みに合わせて自在に入手できる異種メディア横断型検索エンジンも開発しました(図4)。これまでできなかった、画像から音楽を探したり、逆に音楽から画像を探したり、さらには、自分自身に似ているユーザや全く好みが違っている他のユーザからもネットワークを通して自動で推薦を受けることができます。人間は新しい発見をする時に感動や喜びを覚えます。近い将来、画像や映像、音楽等の世界中のあらゆる情報から、予想外の発見ができる検索システムが生まれ、皆さんの生活を豊かにしてくれると考えています。

図3 連想型映像検索エンジン (Video Vortex)

図4異種メディア横断型検索エンジン (Tri-Media Vortex)

研究成果が産業に生かされ、そして生活を豊かにすることが研究者の喜び


 私が行っている、知識獲得のプロセスを分析する研究は、言い換えると、人間にどのようにすれば「気づき」や「きっかけ」を与えることができるかを探究していることになります。得られた知見で多くの人を支援できれば、社会の生産性向上につながると考えています。知的に探究し、学問の発展に貢献するのはもちろんですが、それが生活や産業に活かされ、社会に貢献することが、私たち研究者にとって大きな励みになります。自分自身で生み出した研究成果が皆さんの生活を豊かにするために役立つことが私たち研究者の喜びです。

現在の研究室動向


 長谷山研究室では、伝統的な画像処理の分野だけでなく、新しい学術領域の創出を目指し、人間の視覚・聴覚特性を基盤とした認識システムや楽曲や画像、映像を理解する次世代マルチメディアシステムの実現を試みています。
 具体的に、画像・映像・音響・音楽などを対象に符号化、復元、認識、意味理解、コンピュータグラフィックスの5つの基礎テーマを設け、さらにこれら5つの基礎技術から、多様なメディアを有機的に横断する次世代情報アクセスシステムCyber Space Navigatorを立ち上げています。Cyber Space Navigatorの代表的な技術として、上で示したWeb上に存在する画像や映像から自分が求めるものを効率的に検索するインタフェース等が開発されてきました。
 これからも新しい技術を生み出していくことが、我々の目標です。

研究室ホームページ

http://ladon.ist.hokudai.ac.jp/


長谷山教授の最新のシーズ技術はこちらよりご覧いただけます(2016年研究シーズ集 vol.3掲載)

北海道大学 TLO通信 創業デスク 北海道大学研究シーズ集 vol.4
食科学プラットフォーム 北海道大学URAステーション 北海道大学 研究者総覧 onちゃん北大事務局