| 報告者氏名 | 青井 桂子 |
| 学会名 | 情報処理学会(IPSJ) |
| 研究会名 | 第10回MPSシンポジウム |
| 会場 | 同志社大学 京田辺キャンパス |
| 場所 | 京都府京田辺市 |
| 日程 | 2003/10/23〜2003/10/24 |
| 発表日 | 2003/10/23 |
| 題目 | NetSolve Systemを用いたPSA/GAcによるタンパク質立体構造予測 |
| 著者 | ○青井 桂子,廣安 知之,三木 光範,岡本祐幸(分子科学研究所),Jack Dongarra(University of Tennessee) |
| 原稿 | [ PDF ] [ PPT ] |
| 収録 | 情報処理学会シンポジウムシリーズ MPSシンポジウム論文集, Vol. 2003, No. 14, pp. 74 - 81, 2003 |
今回参加したのは情報処理学会(IPSJ)の第10回MPSシンポジウムです.平成15年10月23日〜24日の2日間,同志社大学 京田辺キャンパス(京都府京田辺市)において開催されました.
情報処理学会は,コンピュータとコミュニケーションを中心とした情報処理に関する学術,技術の進歩発展と普及啓蒙を図り,会員相互間および関連学協会との連絡研修の場となり,学術,文化,産業の発展に寄与することを目的として,1960年4月に設立されました.
第10回MPSシンポジウムは,情報処理学会の数理モデル化と問題解決(MPS)研究会の企画であり,日本での,並列・分散処理を必要とする問題の提示,問題解決の方法論,結果の検討などを広く議論ができる場です. 並列・分散処理のためのシステムやソフトウェア・ミドルウェアだけでなく,問題解決の視点から幅広い分野の統一的な意見交換や討論が行われます.











本研究では,Grid環境におけるタンパク質エネルギー最小化による立体構造予測システムを構築する. 最適化アルゴリズムにはタンパク質のエネルギー最小化に有効であるとされている遺伝的交叉を用いた並列シミュレーテッドアニーリング(Parallel Simulated Annealing using Genetic Crossover : PSA/GAc)を用いた. 最適化アルゴリズムを用いたタンパク質のエネルギー最小化には,多くの反復計算が必要となる.このため,様々な機関の計算資源を結びつけりことにより,大規模な計算資源を利用できるGrid環境を利用することが解決策の1つとして考えられる.本研究では,Grid環境を構築するためのツールとしてGridRPCシステムの1つであるNetSolveを用いた. 本研究では,Grid環境に適した非同期モデルを実装し,同期モデルとの解探索性能や実行時間を比較し,非同期モデルの有効性を検討する.また,Grid環境で計算を実行する際には,オーバーヘッドが生じる.PSA/GAcにおいては,Serverで実行するSAのステップ数を変えることにより,計算時間を調節することができる. そのため,Serverで行うSAのステップ数を見積もる.
私が講演発表を行ったセッションは,「タンパク質構造予測, 並列計算,グリッド」に関するセッションです. 本セッションでは,以下の3件の講演(各30分)が行われました.このセッションでは, 私の講演発表の共著者である岡本先生(岡崎国立共同研究機構 分子科学研究所)をはじめ, 1番目の発表者の共著者である松岡先生(東京工業大学,国立情報学研究所)や,中田さん(産業技術総合研究所),そして2番目に発表された阿久津先生(京都大学)など,グリッド,バイオインフォマティクス分野の研究者がいらっしゃる中での発表でした.また, 座長は昨年度同志社大学大学院の知識工学専攻の博士課程を卒業され,現在産業技術総合研究所に所属されている渡邉真也さんでした.そのため,安心して発表できました.
| 表題 | 著者 | 所属 |
| レプリカ交換分子動力学シミュレータREMD Toolkitのグリッド上での実行 | 佐藤 仁,伊藤正勝,中田秀基,松岡聡 | 東京工業大学,産業技術総合研究所,国立情報学研究所 |
| カーネル法と並列計算機を用いたタンパク質配列分類 | 西郷浩人,Jean-Philippe Vert,上田展久,阿久津達也 | 京都大学 化学研究所 バイオインフォマティクスセンタ パリ高等鉱山学校 |
| NetSolve Systemを用いたPSA/GAcによるタンパク質立体構造予測 | 青井桂子,廣安知之,三木光範,岡本祐幸,Jack Dongarra | 同志社大学大学院,同志社大学,岡崎国立共同研究機構 分子科学研究所,University of Tennessee |
| グリッドに対する独立粗粒度タスク集合の動的スケジューリングのための近似アルゴリズム | 藤本典幸,萩原兼一 | 大阪大学 |

本発表に対して,会場から4件の質問がありました.
| 1 | Q | 1台だけ性能の悪いマシンがあった場合はどうなるのか? |
| A | 非同期モデルはServerからClientに返された結果を順に用いる. このため,遅いServerを待たずに実行できるため,実行時間には影響しない. | |
| 2 | Q | 適切な交叉間隔を決定できるとあるが,今回実験した小さなたんぱく質だけでなく, 一般的なものにもあてはまり,計算時間が見積もれるのか? |
| A | 今回用いたエネルギー関数では構造エネルギー式より,原子数に比例した計算を行うと考えられる. 勿論,用いるエネルギー関数を変更すれば今回の見積りとは異なると考えられる. ここで示したMet-enkephalinとC-peptide以外にもPTH(1-34)などにも適用し,同様の結果を得ている. また現在は,数百残基からなる一般的なタンパク質は解いていないため,一般的なタンパク質に関しては今後検討が必要である. | |
| 3 | Q | 同期では全部待ち,非同期では2個体だけ待っていたがこの間で解のよさが変わるのか? トレードオフがあるのかどうか? |
| A | これまでとったデータにはトレードオフの関係はみられない.というのも,非同期モデルが同期モデルと同様に,ランダム性を失っていないためである. NetSolveではRPC要求を行った場合に要求した問題を解くことのできるServerをランダムに選択する. このため,十分にServerが用意されている場合には,ある個体は遅いServerにも早いServerにも投げられる可能性があり,どの個体とも交叉が行われる可能性がある. | |
| 4 | Q | オーバーヘッドを隠すメカニズムのところで,通信状況は刻一刻変わるが、それに対する方法や今後の課題は? また,ネットワークがつながらなくなったときの対応をどうやっているのか? |
| A | ご質問の通り,今回はネットワークの状況が変わらない場合の実験を行った.このため,オーバーヘッドを隠すメカニズムのためのパラメータに関しても今後,検討が必要である.また,今回の実験で用いた実装では,RPCがある一定数帰って来ることを終了条件としている.あるServerから個体が帰ってこない場合も,他の個体が余分にServerに投げられるため,途中でServerがネットワークから切り離された場合にも終了しないことはない. |
本シンポジウムでは,並列計算研究で著名なJack Dongarra 氏(University of Tennessee)や松岡聡 氏(東京工業大学,国立情報学研究所)の講演や,日本のバイオインフォマティクスの権威である秋山泰 氏 の講演がありました.
これらの講演を拝聴できたことは,非常に貴重な経験であったと思います.
私自身も研究室以外の人から質問していただけ,非常に有意義でしたし,同じセッションの講演で自分の研究と非常に近い発表があり,いい意味で刺激になりました.
今回の学会参加に向けて指導していただいた,三木・廣安両先生に感謝します.ご助言を頂いた本研究室の学生に感謝します.