御挨拶

2011年4月以降のバイオインフォマティクス研究室は、旧画像・生命情報工学研究室を包含した組織になりました。そちらについては別ページに詳細な情報がありますので、ここでは主に生命情報系の部分について紹介します。

当研究室では、生物学や医学に関係したデータに対し、情報処理技術を用いて新しい光を当てることを目的として、様々な研究を行っています。データについては、遺伝子配列データやタンパク質の立体構造データ、相互作用データ、がん関連の遺伝子発現データ、レントゲン撮影の画像データ、文献アブストラクトに書かれた言葉のデータなど、必要とあれば何でも使いますし、使用する情報処理技術も機械学習やデータマイニング、自然言語処理、画像処理、データベース、Web、並列処理など様々です。プロジェクト制ではなく、各学生の興味やスキルを考慮して研究テーマを決めるようにしています。同学年ではなるべく違うテーマになるよう配慮していますので、別の人に寄りかかってテーマを進めることはできないのですが、その代わり自分のテーマに関してはいくらでも深く追及することができます。過去のテーマに関しては「論文・発表等」のページが参考になるかと思います。

研究設備については「設備」のページに写真入りで書いていますので、そちらを御覧下さい。基本的にコンピュータ系の設備だけで、バイオ系の実験設備は全くありません。そのため、研究室内でバイオ実験等を行うことはできないのですが、がん研究所と共同研究を行っていますので、バイオ実験をやりたい方も歓迎しています(下の写真を参照)。卒業後の進路についてはこれまでのところ、大部分の学生が情報系の会社に就職し、残りは公務員という感じです。東北大学や東京大学など、他大学に進学する例もあります。

我々が興味を持っているトピックスは毎年少しずつ変わっているので、全てを詳細に説明することは難しいのですが、2007年以降の主なキーワードを一応挙げておきます。参考になれば幸いです。

【バイオ系のキーワード】遺伝子配列やアミノ酸配列からの各種の予測(ヒストン修飾予測、タンパク質ファミリー予測、生物種推定)、遺伝子発現データの解析と予測(複数データセットの比較によるデータセット特異的遺伝子の絞り込み、遺伝子発現量予測)、タンパク質の配列-構造相関に関する解析(抗原エピトープ領域の配列と立体構造の関係)、タンパク質相互作用予測、疾病関連遺伝子の解析、コンピュータ支援診断(胸部X線画像から腫瘤を認識)、エピジェネティクス、次世代シーケンサ、メタゲノム、微生物ゲノム、抗がん剤

【情報系のキーワード】分類(クラスラベルの学習と予測)、回帰(数値データの学習と予測)、クラスタリング、サンプリング、データマイニング(科学的知識の発見)、自然言語処理(意味解析)、テキストマイニング、画像処理、大規模データ処理