460 生物学467 遺伝子学467.3 生命情報学


生命情報学

ヒトX染色体の地図

 バイオインフォマティクス(英語:bioinformatics)、生命情報学は、生物学の分野のひとつで、遺伝子やタンパク質の構造といった生命が持っている「情報」と言えるものを分析することで生命について調べる、といった分野である。
 主な研究対象分野に、遺伝子予測、遺伝子機能予測、遺伝子分類、配列アラインメント、ゲノムアセンブリ、タンパク質構造アラインメント、タンパク質構造予測、遺伝子発現解析、タンパク質間相互作用の予測、進化のモデリングなどがある。
 近年多くの生物を対象に実施されているゲノムプロジェクトによって大量の情報が得られる一方、それらの情報から生物学的な意味を抽出することが困難であることが広く認識されるようになり、バイオインフォマティクスの重要性が注目されている。
 この一方遺伝子情報は核酸の配列というデジタル情報に近い性格を持っているために、コンピューターとの親和性が高いことが本分野の発展の理由になっている。
 さらにマイクロアレイなどの網羅的な解析技術の発展に伴って、遺伝子発現のプロファイリング、クラスタリング、アノテーション(注釈)、大量のデータを視覚的に表現する手法などが重要になってきている。こういった個別の遺伝子、タンパク質の解析等から更に一歩進み、生命を遺伝子やタンパク質のネットワークとして捉え、その総体をシステムとして理解しようとするシステム生物学という分野もある。


ページトップへ


応用例

 たとえばヒトゲノム計画では、ある配列断片から順番に配列を解読する手法が考えられていたが、クレイグ・ベンターらによるショットガン法により遥かに高効率で解読が進められるようになった。ショットガン法はゲノム配列をバラバラな短い断片に分断してそれぞれを解読し、その後同一の配列を重複する領域として並べ替えることによってゲノム配列を再現するが、多くの断片がある中で正しい並び方を決定することはコンピュータの計算能力がなければ不可能である。このような元の長い配列を再現する計算は配列アセンブリングと呼ばれ、バイオインフォマティクスの中でも重要なテーマの一つとなっている。

主な手法

 バイオインフォマティクスの手法として多用されるものの一つが相同性検索である。なかでもBLASTは相同性検索プログラムとして多用されている。このプログラムは配列(シーケンス)の断片を問い合わせ情報として与えられると、その配列に最も類似した配列を NCBI (GenBank) などの配列データベース中から検索する。検索結果は、クローニングした遺伝子の部分情報から遺伝子全体の配列を予測したり、構造が未知のタンパク質の二次構造を予測したり、解読されたゲノムの中から遺伝子を検出してその機能を予測するなどの研究の基盤となる。  

研究対象

 ゲノミクス研究の初期は遺伝子予測などがバイオインフォマティクスの主要な対象であった。しかし、最近はゲノムからの転写物の総体であるトランスクリプトーム、トランスクリプトーム(の一部)が翻訳されたタンパク質の総体であるプロテオーム、タンパク質の二次産物として合成される糖鎖の総体であるグライコーム、更に、ゲノムからの直接、転写・翻訳された実体ではなく、代謝ネットワーク(代謝マップ)によって生じた代謝産物をも含めた総体を考えるメタボローム、生物個体の表現形の総体であるフェノームなど、生物学全体を研究対象とする科学に拡大・発展しつつある。 

バイオインフォマティクスとコンピュータ

バイオインフォマティクスの基本的なワークフローは、以下のようなものである。

  1. ハイ・スループットな実験手法によるデータの蓄積
  2. 目的に応じたデータの加工、標準化
  3. 解析(データマイニング、可視化、その他統計的手法による分析など)

このいずれの段階でもコンピュータは使用される。その形態はパーソナルコンピュータ (PC) を利用したスクリプトによる小規模なシーケンスデータ加工から、産業技術総合研究所生命情報工学研究センターなどによる IBM Blue Gene のような20TFlopsのスーパーコンピュータから大規模なコンピュータ・クラスターやグリッド・コンピューティングを用いたタンパク質の立体構造解析(タンパク質構造予測)まで様々である。


ページトップへ


脚注及びリンク



ページトップへ


WEEF

Copyright (C) WINDOFWEEF All Rights Reserved.
inserted by FC2 system