病理画像処理のためのグリッド・クラウドコンピューティング基盤の基礎的検討

平成21年度北海道大学情報基盤センター共同研究

廣安 知之

研究期間 2009年度

担当者:

背景・目的:

 近年,f-MRIや光トポグラフィといった医用画像の技術が発達し,種々の病理画像が大量に取得可能となってきた.今後の課題は,得られる病理画像から,例えば癌ほうそうを抽出するといったようなデータマイニングの技術の開発である.特にこれらの病理画像は地域に設置されている研究施設や病院など分散的に得られることが予想される.そのため,これらの分散された情報を,擬似的に統一的に取り扱い,かつ,データマイニングする環境は非常に重要となる.
 本研究では,分散された病理画像を擬似的に取り扱いそこからデータマイニングを行う基盤構築を行う際の基礎的な検討を行う.検討する技術は,分散処理技術として利用されてきたグリッドおよび近年特に注目されているクラウドである.
 本研究においては,進化計算手法を利用した分散処理に適したデータマイニング手法についても検討する.アルゴリズムの開発については

  1. 画像処理フィルタ構築におけるGpとSAPの比較, 藤田 宗佑, 廣安 知之, 三木 光範, 渡辺 章人, 計測自動制御学会 システム・情報部門学術講演会2008 講演論文集, pp.585-588, (2008)
  2. 「画像におけるノイズ除去装置」廣安(特願2009-060829号)(特許出願済み)
などにおいて研究をすでに開始済みである.

研究計画・方法:

グリッド・クラウドシステムの構築:

同志社大学および北海道大学に設置されたレポジトリ装置を仮想的に統合することによって病理画像のためのレポジトリ装置を設置する.また,同志社大学および北海道大学に設置されている計算機によりデータマイニングを行う.使用するシステムはオープンソースを中心に検討し,開発されたシステムはできるだけ外部に公開する.

データマイニングアルゴリズムの開発:

病理画像からターゲット(例えば癌ほうそう)を抽出するアルゴリズムを開発する.代表者である廣安および棟朝は進化計算領域において多くの成果をあげており,進化計算を利用してこのアルゴリズムを開発する.既存のクラスタリングが行列処理手法を大規模な問題に適用できるようなモデルの検討も行う.

情報交流会の開催:

テネシー大学のJack Dongarra教授を招聘し,北海道大学にて情報交流会を開催する.Jack Dongarra博士はで長年,並列・分散処理の研究を行い,特に分散並列環境におけるライブラリ構築の大家である.データマイニングを分散処理環境で行うためには,分散環境に適応した大規模行列ライブラリの利用が必須である.

研究成果:

システムの構築:

ここでは基本的なシステムを構築するために必要な要件を検討した.大規模なレポジトリとネットワークが必要であり,かつセキュリティについても配慮することが必要であることが明らかとなった.セキュリティについても,レポジトリ内にあるデータが不用意に外部に流出しないことや意図しないユーザーにデータのアクセスや改竄をされないなどといったこと以外にも,病理画像においては,その画像が本人の画像であることを保証することが重要であることが明らかとなった.

アルゴリズムの構築:

アルゴリズムについては,病理画像に対して自動プログラミング手法を用いた画像処理フィルタの自動構築手法について検討した.画像処理フィルタは,木構造として定義可能である.そのため,自動プログラミング手法には,木構造を決定することが可能なアルゴリズムである遺伝的プログラミング(GP),シミュレーテッドア ニーリングプログラミング(SAP)を用い,両手法の比較を行なった.本内容については下記の研究会にて発表を行った.

講演会の開催:

2010年1月25日(月)14:00 ~ 15:30の日程で,北海道大学 百年記念会館 大会議室において,テネシー大学のJack Dongarra教授を招聘し,“Five Important Concepts to Consider when Using High Performance Computers” と題した講演会を開催した. 今後のスーパーコンピュータのあり方について深く示唆に富んだ講演を頂いた.

pdf

謝辞:

本研究は,平成21年度北海道大学情報基盤センター共同研究として行われた.研究環境を準備してくれた北海道大学のスタッフのみなさまに感謝する.また,強力に本研究を推進した研究分担者の棟朝教授に感謝する.また,北海道大学においてご講演いただいたJack Dongarra教授にも感謝の意を表する.