シーズ技術紹介

【情報通信】 (2016/03/09公開)

大規模データアクセス技術

大学院情報科学研究科 情報理工学専攻
喜田 拓也 准教授

北海道大学研究シーズ集webサイトオープンのお知らせ

かねてより準備を進めておりました北海道大学研究シーズ集webサイトをオープンいたしました。

本研究者の研究シーズはこちらです↓↓

https://seeds.mcip.hokudai.ac.jp/jp/view/153/
ご利用者様・サイト訪問者様により使いやすく、質の良い情報を発信していけるよう、更新をしてまいります。北海道大学研究シーズ集webサイトをよろしくお願いいたします。





高度なデータ圧縮・データ索引技術による超高速検索


データをコンパクトに圧縮したり、高度で省メモリなデータ索引を構築したりすることで、大規模なデータ群に対する効率の良いデータアクセスを実現することを目指しています。

研究の内容


これまでに喜田らが提案した新しいデータ圧縮手法であるRepair-VF 符号化は、データをコンパクトに格納しつつ、その後のデータ解析やキーワード検索、あるいは部分的なデータ更新などが簡便に行えるという特長を持っています。

例えば、図1 は圧縮データに対するキーワード検索のパフォーマンス比較の結果ですが、世界的にデファクトスタンダードな圧縮ツールであるgzip で圧縮されたデータ上での検索に比べて圧倒的に高速です。

こうした特長を持つデータ圧縮法は、従来、データの圧縮率(元のデータに比べて、どのくらい小さく圧縮できるか)という観点では見劣りするものばかりでした。

しかし、Repair-VF は、非常に良好な圧縮性能を達成しています(図2)。また近年の研究により、その元になったデータ圧縮法はある種の索引構造としての側面を持つことが分かってきました。

応用例


  • 高速なストリームデータ解析
  • 大規模データからのデータマイニング
  • オンメモリDB システム
  • 大規模な画像・音楽情報の検索

産業界へのアピールポイント


情報知識ネットワーク研究室では、主にアルゴリズムの改善による情報検索やデータマイニングの効率化について研究をしています。

具体的には、データ圧縮法、索引構築アルゴリズム、パターン照合アルゴリズム、列挙アルゴリズムの設計や応用について優れた成果があります。

研究室ホームページ


大学院情報科学研究科 情報理工学専攻 情報知識ネットワーク研究室
http://www-ikn.ist.hokudai.ac.jp/



※お問い合わせは 北海道大学 産学・地域協働推進機構ワンストップ窓口まで
Update 2018-04-17
北海道大学 北海道大学 研究者総覧 onちゃん北大事務局 北海道大学研究シーズ集Webサイト
EARTHonEDGE北海道 DEMOLA HOKKAIDO 創業デスク 北海道大学 産学連携メールマガジン