スパースモデリングの深化と高次元データ駆動科学の創成

可視化班(C01-4)

研究課題名：スパースモデリングを促進する可視化基盤の強化

研究代表者：藤代一成（慶應義塾大学　理工学部　教授）

研究分担者：高橋成雄（福島県立会津大学　コンピュータ理工学部　教授）

研究分担者：渡辺一帆（豊橋技術科学大学　情報・知能工学系　講師）

研究概要

本研究は，スパースモデリングにより抽出されたデータの十数から数十次元の説明変数を，可視化を用いてさらに2,3,4 次元まで圧縮し，所与の問題を記述する物理スペースにおけるデータの振舞いを視覚的に理解させる情報スペースに変換する基盤技術を構築する．ここでは，そのデータ解析処理に対し明示的に解析者の視覚的フィードバックを取り込み，スパースモデリングに基づく高次元データの解析処理において，人の対話処理が可能となるHuman-in-the-Loop を実現し，データ駆動科学に対し大幅な促進を図る．

本研究に関連する国内・国外の研究動向及び位置づけ

機械学習分野において，スパースモデリングは，高次元データの疎性の仮定に基づき，データに潜在する重要な振舞いをより少ない説明変数で記述するための効果的な手法を提供する．しかし，その結果は十数から数十次元への圧縮にとどまり，そこから2,3,4 次元表現への圧縮は，情報量保存などの観点が中心であり，人の介在による視覚的理解を意識した手法は未だに確立していない．一方，可視化分野においても，高次元データ可視化は，データに含まれる変数間の相関を発見する道具として，近年集中的に研究されている．しかし，そのデータの可視化技術は，単純な変数の組合せによる可視化や単純な次元圧縮手法に限られ，データの本質的な特徴の抽出にまでは至っているとは言えない．

これまでの研究成果を踏まえ，着想に至った経緯

我々は，近年高次元データの解析に関する研究に従事し，機械学習と可視化の両分野で成果を発表してきた．そして，機械学習がスパースモデリングを用いて高次元データを効果的に次元圧縮できる手法を，また可視化が低次元視覚情報への変換を通してデータ理解を促進する手法を提供できる点において，相補的な関係にある点に気づき，両者を融合させることで，高次元データ解析技術を格段に向上させる基本アイディアの着想に至った．

本計画研究の目的

解析者が視覚フィードバックによりデータ解析を制御できるよう，人を高次元データ解析処理に明示的に取り込むHuman-in-the-Loop を実現するため，次の三課題に取り組む．

【課題1】最適商写像選択過程の機械学習

可視化システムと解析者との対話的処理の履歴を機械学習し，データを低次元空間に写像する適切な商写像を提示可能にする．履歴から抽出した様々な特徴量に対する確率モデルを仮定し，視覚的顕著性に着目したベイズ推論を適用することで，設計される商写像の性質を調べる(下図(a))．

【課題2】商写像表現変換のための潜在変数モデリング

スパースモデリングにより得られる数十から十数次元のデータを，可視化に適した低次元表現に変換する手法の構築を行う．具体的には，スパースモデリングから得られるサンプルデータを，その隣接関係から構築されるグラフに変換し，微分位相に基づく同値関係の商写像として低次元の多様体構造を計算し，特徴を抽出する(右図(b))．

【課題3】次元圧縮写像の視覚メタファとグリフ設計

【課題2】で得られた低次元データをわかりやすい視覚情報へ変換する原理を定式化する．具体的には，従来の高次元データ可視化と，商写像表現に用いられてきた各種の視覚パタンを再精査し，スパースモデリングの可視化向けに最適化された視覚メタファ(原理を喩える実世界対象)とグリフ（アイコン，絵文字）定義の基本設計を，カスタマイズ可能にする(下図(c))．