今回参加したのはシステム制御情報学会の第46回研究発表講演会(SCI-02)です.平成14年5月15日〜17日の3日間,神戸国際会議場において開催されました.
システム制御情報学会は,1957年「日本自動制御協会」の名称で設立され,以来40年にわたり制御工学およびシステム工学に関する,学術および技術の向上を目指し,産・学・官一体となって活動している学会です.1988年6月に「システム制御情報学会」と名称が変更されました.会誌「システム/制御/情報」および論文誌「システム制御情報学会論文誌」の発行と,研究発表講演会などの開催や研究分科会の設置により,先端的な学術振興を図るとともに,啓発的なシンポジウムや講習会を開催して,産業界の技術向上にも寄与しています.[1]

今回,「創発システムとインタラクション」というセッションにおいて,「Actor-Criticを用いた知的ネットワークシステムの提案」というテーマで発表を行いました.近年の人工物が知的性質を具備しているという点から,それらをネットワークに接続することによって,より協調的な動作が可能となる知的ネットワークシステムの提案しました.実現には,各機器が環境を柔軟に判断する必要があるため,今回は強化学習によって判断基準を自律的に獲得させています.
具体的には,Q-LearningとActor-Criticという二つの代表的な強化学習手法を用いて比較を行いました.あらかじめ行動を決定する必要があるQ-Learningに比べ,Actor-Criticでは連続的な行動の幅を決定しておく必要があるが,そのパラメータへの依存はQ-Learningに比べると小さい.このような行動に関するパラメータというのはユーザが設定する必要があると考えられるため,ユーザの負担を軽減するという観点からActor-Criticが有効であるということを発表しました.

[質問] : 障害が起きたときに対する対応というのは,過学習に対する対応に通じるものがあると思う.アクタークリティックには,この点における特別なファクターがあるのか?
[回答] : Q-learning
は行動(行動の幅)をパラメータによって限定しているのに対して,アクタークリティックは行動が柔軟に変化する.
(ここでQ-leaningとアクタークリティックの障害時における履歴を用いて行動の幅が柔軟に対応することによってよりスムーズに照度の変化が起きている様子を説明)
発表終了後,南京街へと繰り出し,打ち上げをしました.
発表までは結構緊張していたため,余り周りが見えていなかったけれど,発表終了後の散策ではいろいろと目についた.やっぱり余裕は大切である.
普通に歩いていると,どこからともなくいいにおいが・・・.
中華料理料理のコースをを堪能しました.普段は,シーフード類があまり得意ではないため避けていたのだけれど,あそこで食べたものは本当においしかったです.生まれて初めて食べた(飲んだ?)タピオカなるものも,印象が強かったです.

初めての学会参加ということで,最初は緊張していましたが,会場は普段の研究室内での発表のそれよりも小さく,緊張も少なく発表することができました.「創発システムとインタラクション」のセッションにて発表したわけですが,ニューラルネットワークについての発表が多かったので,プログラムを見たときには少し違う中に入ってしまったかなとも思いましたが,実際に発表してみると質問も出てきて非常に有意義な時間を過ごすことができました.質問されてうれしかったのも初めてでした.
学会に参加し,自分の研究を発表し,そして他の人の研究発表を聴講することによりこんなにも多くの刺激を得られるのだと,学会に参加することが有意義であることを実感しました.