The Applied Computational Intelligence Laboratory
知識工学講座 応用計算知能研究室
木村 周平 教授
徳久 雅人 講師
本研究室では、知識工学の技術を応用した研究に取り組んでいます。
最適化問題を応用し、生物分野の問題を解く。
基礎技術:進化的アルゴリズム (GA)
応用技術:遺伝子ネットワーク同定問題
自然言語処理を応用し、観光振興への支援技術を開発する。
基礎技術:意味解析、感情推定
応用技術:観光情報の推薦
解説
最適化問題と遺伝子ネットワーク
生物はタンパク質でできています。タンパク質は遺伝子ネットワークにより作られており、その性質も遺伝子ネットワークにより決まるところがあります。遺伝子に関する病気の克服や薬の開発のためには、遺伝子ネットワークを計算機で自動的に解析する技術が必要になります。そこで、本研究室では、最適化問題を応用してその解析に取り組んでいます。
遺伝子ネットワークは、ある遺伝子の動きが別の遺伝子に作用することをモデル化したものです。遺伝子の1つ1つをノードとし、作用のあることをアークとしたネットワークとなります。生物のタンパク質の状態を観測したデータから、ネットワークの形を推定することを遺伝子ネットワーク同定問題といいます。観測データは、遺伝子の場所ごとに観測されており、時間軸にそって変化した様子が集められています。しかし、どの遺伝子の状態がどの遺伝子の状態に影響を与えたのかはわかりません。ネットワーク同定問題とは、この影響の関係を推定することです。
最適化問題は、パラメータで定義された関数について、最大値や最小値をとるためのパラメータを求める問題です。遺伝子ネットワークは、たくさんのパラメータで定義された関数で表わすことができます。予想したパラメータでの関数で観測データとほぼ同じものが生成できれば、そのパラメータは正解です。最適化問題では、予想した関数の値と観測データの誤差を最小にすることを狙っています。
たとえば、y = ax + b という関数は、パラメータが 2 つ (a, b) であり、変数 x, y はそれぞれスカラ (1次元) です。たくさんの x と y の値があるとき、それらを最も良く満たす a と b を決めることは、簡単にできそうですね。しかし、遺伝子ネットワークにおいては、パラメータの数が非常に多いため、その推定は容易ではありません。興味のある人は、研究室に来てチャレンジしてみてください。
自然言語処理と観光情報
観光では、普段は行かない所へ行き、何かしらの体験をしてくることをします。多くの場合、美味しいものを食べたり、楽しい遊びをしたり、リッチな体験をしたりしており、最近では、SNS(フェイスブックやツイッター) やブログを通じて、たくさんの報告があげられています。旅行者は、良い体験を容易に、かつ、確実に得るために、旅行の計画をたて、予約などの準備を行ないます。一方、旅行業者は、顧客の満足度を高め、かつ、利益を上げるために、質の向上と効率化を追求します。そのために、観光情報の利用が必要不可欠になります。そこで、本研究室では、自然言語処理を応用して、その活用の支援技術の開発に取り組んでいます。
観光情報と呼べる情報は、たくさんの種類があります。例えば、美味しいお店のリスト、口コミ情報や星の数、イベント企画とその日時場所というものは旅行の計画作り(プランニング)に必要です。また、名所ではガイドさんが逸話を語ってくれます。現地で実物を見ながら聞く解説はイマジネーションの世界につれていってくれますので、解説情報も重要です。人々の噂や体験談は、観光地の開発や改善に役立ちます。
SNS やブログ、あるいは、新聞記事や Wikipedia などインターネット上の情報は、こうした観光情報を自然言語で記述しています。日本語の表現について、評判を表す特徴をつかむと、口コミ情報の自動分析につながります。日時や場所の特徴をつかむとイベント情報の自動収集につながります。Wikipedia には細かいことが書かれていますが、よく読むとガイドさんが逸話で喋っていても不思議ではないことが書かれていますので、面白い部分を自動判定できると、ガイド本としての効果が得られます。
日本語の表現の特徴をつかむ上で、観光においていは特に感情は重要な手がかりになります。場所や時間の表現はもちろん、単語の意味を判定することも重要になります。また、各文書で使われる単語の頻度も文書の特徴を分析する上で使われます。言語の情報を上手に分析するテクニックが必要となります。さて、将来、マーケティングなどの分析や情報授受ツールの作成において役立つことが勉強できると思います。
コラボレーション
たくさんの遺伝子の状態、たくさんの人々のつぶやき、どちらも多次元の観測データです。遺伝子ネットワーク同定問題も観光情報の分析も観測データの特徴抽出に関する技術になります。多くの多次元データを同時に合理的に分析する技術は、適用する対象が異なる卒業研究等の間でも、関連性がみられます。本研究室では、隣りの席の人の方法が、自分の方法のヒントになります。ゆえに、本研究室は、面白い発想ができる環境になっています。
卒業研究
本研究室は、コンピュータ・サイエンスのプログラムを履修していることを推奨しています(2015年度入学生向け情報)。
現在(2015年度) の卒業研究のテーマ(仮)は次のとおりです。
最適化問題と遺伝子ネットワーク
超一様分布列を用いることによる REXstar/JGG の性能改善
遺伝子ネットワークの Vohradský モデルの同定: AIC を用いたモデルの複雑さの自動調節
階層モデルを用いたネットワーク解析結果の平均化による精度向上
次数相関を利用した遺伝子ネットワークの同定精度の改善
自然言語処理と観光情報
Semantic Orientation を用いた状況判定による感情推定に関する研究
機械学習による名詞述語文パターンの適合性判定
Wikipedia からの旅行者向け閲読箇所の推薦に関する研究
修士論文
大学院に進学し、より丁寧な理論構築、ならびに、情報処理プログラムの実装に励んでもらいたいと思います。
現在(2015年度) の進行中のテーマ(仮)は次のとおりです。
遺伝子ネットワークの Vohradský モデルの同定: 効率的パラメータ推定手法の提案
遺伝子ネットワークの簡略版 S-system モデル同定
ブログ記事からの行動順序対の抽出に関する研究
旅行ブログ記事からの事象のカテゴリ化
年報
平成27年度, 2015年度 (2015.April - 2016.March)
学術論文
徳久雅人, 高原明日美, 村田真樹, 村上仁一: 観光開発の発案を支援するための文抽出, 観光と情報, Vol.11, No.1, pp.35-44, 2015.
国際会議
Shuhei Kimura, Mariko Okada-Hatakeyama: Improvement of Reliabilities of Regulations using a Hierarchical Structure in a Genetic Network, In Proceedings of the 2015 International Joint Conference on Neural Networks (IJCNN), 2015, July 12-17, Killarney, Ireland.
口頭発表
徳久雅人: 存在属性付き結合価パターンを用いた存在性解析の試み, 電子情報通信学会技術研究報告, 思考と言語, Vol.115, No.69, pp.19-24, 2015, 6月4-5日, 徳島(徳島大学).
徳久雅人, 沖本観月, 村田真樹, 村上仁一: 観光地巡りを盛り上げるための観光地情報表示アプリの開発, 第12回観光情報学会全国大会講演予稿集, pp.66-67, 2015, 6月19-20日, 石川(近江町交流プラザ).
- 石原有規, 徳久雅人, 木村周平, 奥健太: Wikipedia からの旅行者向け解説文章の推薦, 電子情報通信学会技術研究報告, 言語理解とコミュニケーション, NLC2015-48, Vol.115, No.445, pp.19-23, 2016, 2月4-5日, 京都(キャンパスプラザ京都).
- 竹内希史, 徳久雅人, 木村周平: 病院ブログ記事からの動詞対の抽出, 電子情報通信学会技術研究報告, 言語理解とコミュニケーション研究会, NLC2015-50, Vol.115, No.445, pp.35-39, 2016, 2月4-5日, 京都(キャンパスプラザ京都).
連絡先: tokuhisa@eecs.tottori-u.ac.jp
所在: 〒680-8552 鳥取県鳥取市湖山町南4-101
場所: 工学部知能情報工学科棟 4階 4805室
since 2015.12/15
last update 2016.7/7