Nrthugu

DNAシークエンシング (DNA sequencing) とは、DNAを構成するヌクレオチドの結合順序（塩基配列）を決定することである。DNAは生物の遺伝情報のほとんど全てを担う分子であり、基本的には塩基配列の形で符号化されているため、DNAシークエンシングは遺伝情報を解析するための基本手段となっている。手法としては1977年に開発されたサンガー法が改良を加えながら用いられているが、最近新しい方法も開発されており中には実用化されているものもある。

DNAの塩基配列には生命体に必要な情報が符号化されているので、配列決定はミクロなレベルの生物学の基盤となっており、分類学や生態学のようなマクロな生物学でも盛んに応用されている。また医学面でも遺伝病や感染症の診断や治療法の開発などに役立っている。ウォルター・ギルバートとフレデリック・サンガーは、DNAシークエンシングの手法を開発した功績により1980年のノーベル化学賞を受賞している。

1 各決定方法
- 1.1 DNA断片長による方法
  - 1.1.1 反応
    - 1.1.1.1 酵素法
    - 1.1.1.2 化学分解法
  - 1.1.2 検出
  - 1.1.3 自動化
- 1.2 質量分析
- 1.3 DNA合成を監視する方法
  - 1.3.1 パイロシークエンシング
- 1.4 DNA分解を監視する方法
- 1.5 ハイブリダイゼーションを利用する方法
- 1.6 顕微鏡による方法

2 歴史

3 参考文献

4 外部リンク

各決定方法

DNA断片長による方法

断片長データの例
塩基	長さ
アデニン(A)	6 7 8 10 13
グアニン(G)	1 5 12
シトシン(C)	3 9
チミン(T)	2 4 11 14 15

現在主流となっているのは、塩基依存的にDNA断片を作製し、その長さを比べることで塩基の順序を知る方法である。例えば4種類の塩基に対応してサンプルを1回ずつ切断した結果、右表のような長さの断片ができたとする。この場合、断片長が短い方から並べ直したGTCTGAAACATGATTが、元々のDNAの塩基配列だったということになる。この方法では、どのように「塩基依存的」なDNA断片を作製するかという反応の部分と、どうやってその長さを調べるかという検出の部分に鍵がある。

例: 元の配列 GTCTGAAACATGATT

アデニン(A)で切断した場合

[06] GTCTGA <-> AACATGATT

[07] GTCTGAA <-> ACATGATT

[08] GTCTGAAA <-> CATGATT

[10] GTCTGAAACA <-> TGATT

[13] GTCTGAAACATGA <-> TT

グアニン(G)で切断した場合

[01] G <-> TCTGAAACATGATT

[05] GTCTG <-> AAACATGATT

[12] GTCTGAAACATG <-> ATT

シトシン(C)で切断した場合

[03] GTC <-> TGAAACATGATT

[09] GTCTGAAAC <-> ATGATT

チミン(T)で切断した場合

[02] GT <-> CTGAAACATGATT

[04] GTCT <-> GAAACATGATT

[11] GTCTGAAACAT <-> GATT

[14] GTCTGAAACATGAT <-> T

[15] GTCTGAAACATGATT

上記の切断した配列を短いほうから並べなおし、切断した塩基（切断した端の塩基）で読むと元の配列が分かる。

[01] G

[02] GT

[03] GTC

[04] GTCT

[05] GTCTG

[06] GTCTGA

[07] GTCTGAA

[08] GTCTGAAA

[09] GTCTGAAAC

[10] GTCTGAAACA

[11] GTCTGAAACAT

[12] GTCTGAAACATG

[13] GTCTGAAACATGA

[14] GTCTGAAACATGAT

[15] GTCTGAAACATGATT

->[01]G [02]T [03]C [04]T [05]G [06]A [07]A [08]A [09]C [10]A [11]T [12]G [13]A [14]T [15]T

反応

酵素法

これはDNA複製酵素であるDNAポリメラーゼを用いて末端が特定の塩基に対応するDNA断片を合成する方法である。まずプライマーとして配列を読みたい1本鎖DNAの特定の位置に相補的なオリゴヌクレオチドを使うことで、DNA合成の開始点を1ヶ所に決める。そこからDNA合成を始めて、それぞれの塩基に対応する位置で合成が止まる様な反応系を使うことで、塩基特異的なDNA断片が得られる。もともとフレデリック・サンガーが中心になって開発したためサンガー法と呼ばれているが、長年にわたって改良が続けられているため必ずしも明確な表現ではない。ここでは改良されていく一連の方法の総称として用いることにする。

サンガーはまず1975年にプラスマイナス法
^[1]
と呼ばれるやや複雑な方法を発表した。これは短時間の単なるDNA合成をした後で、4種類のデオキシリボヌクレオチド（dATP・dGTP・dCTP・dTTP）のうち1種類だけを欠く反応系で合成を再開し（マイナス法）、その結果から配列を解読する方法である。最初に普通のDNA合成をしているので、この段階では合成したDNAの長さはランダムになっている。そこからたとえばdATPのみを欠く系で合成を再開すると、必ずアデニンを組み込むべき位置で反応が止まる。したがって得られたDNA断片は様々な長さのものがあるがランダムではなく、アデニンに対応した断片が得られる。同様に、dGTPのみ、dCTPのみ、dTTPのみを欠く系を用いることで、塩基特異的なDNA断片を得ることができる。原理的にはこれだけで配列が読めるはずだが、実際にはうまく読めない部位がでてしまうため、1種類のデオキシリボヌクレオチドだけを加えた系（プラス法）を4つ追加して、全部で8つの反応系の組み合わせで配列を読む煩雑な方法であった。

サンガーらがこれを改良して1977年に発表した方法
^[2]
が、ジデオキシ法、ないし鎖停止法と呼ばれ広く知られているものである。これは4つの通常のDNA合成系を用意し、そこに低濃度の鎖停止ヌクレオチド（ターミネーター）を加えて反応させるようにしたものである。ターミネーターは4種のジデオキシヌクレオチド (ddATP・ddGTP・ddCTP・ddTTP) のうちそれぞれ1種類だけを用いる。DNAポリメラーゼは鋳型配列に対応するデオキシリボヌクレオチドを取り込みながらDNAを合成していくが、ときどき対応するターミネーターを取り込んで反応がそこで止まってしまうことが起きる。結果的に使ったターミネーターの塩基に対応する様々な長さのDNA断片が生じることになる。例えばターミネーターとしてddATPを加えた系では、生じたDNA断片の3'末端の塩基はアデニンになるという具合である。これならば最初に単なるDNA合成をする必要がないし、4つの反応系だけできちんと配列が確定できる。

サンガー法は後にポリメラーゼ連鎖反応 (PCR) が開発されたことでさらに効率化された。PCRでは2本鎖DNAを高温で変性させてから温度を下げてプライマーを結合させてDNAを合成し、そのあと再び高温で変性させて鋳型DNAを再利用することができる。この発想をサンガー法と組み合わせることで、比較的少ない量の二本鎖DNAから反応を始めることができるようになった。この方法を特にサイクルシークエンス法と呼ぶ。

元々はデオキシリボヌクレオチドに放射性標識しておき、ポリアクリルアミドゲル電気泳動により断片長に応じて分離して、オートラジオグラフィーにより検出していたが、その後、蛍光標識やキャピラリー電気泳動といった技術を取り込むことで飛躍的に発展した（後述）。

サンガー法は酵素反応に依存しているため、PCRと似たような問題点が出ることがある。プライマーによって反応の開始点を決めるので、プライマーの特異性が低いと複数の配列を同時に読むことになり配列を決定できない。これはプライマーを結合させる温度が高くなるように設計することで改善できることがある。また反応系にRNAが混じっているとそれがプライマーとして働いて配列が読めなくなることがある。GC比が高かったり反復配列や二次構造を取りやすい配列があると、そこでDNAポリメラーゼの反応が止まりそれ以降の配列が得られないことがある。これに関しては複製系ではなく翻訳系（RNAポリメラーゼ）を用いた同様のシステムで解決することがある。

化学分解法

アラン・マクサムとウォルター・ギルバートが1977年に報告した
^[3]
手法で、マクサム－ギルバート法ないしギルバート法と呼ばれる。DNA断片中の特定の塩基を試薬により修飾することで、その部位のリン酸ジエステル結合が切れやすくなることを利用している。試薬の作用条件を調節することでDNA断片1分子あたり平均1ヶ所だけが修飾されるようにすると、特定の塩基で切断された様々な長さのDNA断片を得ることができる。配列を決定したいDNA断片の端を³²Pやビオチン、蛍光色素などで標識しておき、フィルムを感光させたり酵素的に色素生成させて検出する方法が一般的である。

元々は以下のような試薬を利用した組み合わせで判別していた。ほかにも様々な塩基特異的な切断反応が考案されている。

ジメチル硫酸: プリン塩基（グアニン・アデニン)をメチル化する。ここでメチル化されたプリン塩基のグリコシド結合は不安定で塩基が遊離しやすく、その後アルカリ条件で加熱することでリン酸ジエステル結合が切断される。グアニンはアデニンと比べて5倍速くメチル化される一方、グリコシド結合はグアニンよりアデニンの方が不安定である。そこで塩基を遊離させるときに、強い条件（高温中性）にするとグアニン塩基で切断されやすく、弱い条件（低温酸性）にするとアデニン塩基で切断されやすい。この2つの反応産物を見比べることでグアニンとアデニンを判別する。
ヒドラジン: ピリミジン塩基（シトシン・チミン）を開裂させる。そのままだと両塩基で切断されるが、高濃度の塩化ナトリウムが存在するとチミンの開裂が阻害されてシトシン塩基だけで切断される。この2つの反応産物を見比べることでシトシンとチミンを判別する。
水酸化ナトリウム: アデニン塩基とシトシン塩基を開裂させる。ジメチル硫酸の弱い条件の代わりに用いる。

この方法は充分な量のDNAと、ヒドラジンなど取り扱いに注意を要する試薬が必要という欠点がある。したがってサンガー法が改善されるとともに、次第に一般的なシークエンスの手法としては用いられなくなった。しかし酵素反応を介さずに直接DNA分子の解析ができることから、修飾塩基を含むような配列決定や、タンパク質との相互作用を検出する目的で使われている。

検出

サンガー法によるオートラジオグラフィーの一部

DNA断片の長さを知るためには普通は電気泳動法を用いて分離する。元来はスラブ（平板）型のポリアクリルアミドゲル電気泳動によって分離するのが主流であった。しかし自動化・高速化の流れの中で1990年にキャピラリー電気泳動による装置が登場し、21世紀を迎えると主流はキャピラリー電気泳動に移った。キャピラリー電気泳動の利点は、径が小さい（0.1mm以下）ことから発熱の制御が容易で、その分高電圧で電気泳動することが可能なため高速・高分解能になることである。最近ではさらに微細・高速化を図るマイクロチップ電気泳動による装置が登場している。

以前は放射性標識が一般的に用いられており、泳動したスラブゲルを乾燥させX線フィルムを感光させて塩基配列を読み取っていたが、放射性標識は取り扱いに制約があることから忌避される傾向がある。あまり一般的ではないがビオチン標識を介した化学発光系を使う方法もある。しかし現在一般的に利用されているのは、蛍光標識を用い自動化されたDNAシークエンサーである。蛍光標識の決定的な利点は、4種類の塩基に対応したそれぞれ波長が異なる蛍光色素で標識することができ、そのため1つの配列を読むのに1つの検出系だけで足りるということである。またX線フィルムの代わりに撮像素子を使うことでより迅速・簡便に利用できる。

マクサム－ギルバート法では配列を決定したいDNA断片の端を標識する以外には方法がないが、サンガー法ではデオキシリボヌクレオチドを標識しておく元々の方法以外にも、プライマーまたはターミネーターを標識しておく方法の計3通りが考えられる。放射性標識の場合、最初は検出感度が良くなるデオキシリボヌクレオチドの標識が使われたが、サイクルシーケンス法により感度が上がるとシグナルが均一になるプライマーの標識が使われるようになった。一方、蛍光標識の場合にはデオキシリボヌクレオチドの標識は合成反応に影響を与える可能性があり好ましくない。

プライマーを蛍光標識する方法をダイプライマー法 (dye-primer) と呼ぶ。この方法ではプライマーの標識とターミネーターの種類を対応させる必要があることから、反応は4つに分けて行い、それを混ぜて泳動することになる。標識プライマーを常に4種類用意する必要があるため、通常は特定のベクターにクローニングして、そのベクター配列を認識する標識済みプライマーを使い回すことになる。

一方、ターミネーターを蛍光標識する方法をダイターミネーター法(dye-terminator)と呼び、こちらが現在の主流となっている。この方法では4種類のターミネーターがそれぞれ異なる蛍光色素で標識されているため、1つの系に4種類のターミネーターを加えて反応を行い、それをそのまま泳動するだけで済む。プライマーを標識する必要がないため、サブクローニングせずに新しくプライマーを設計して続きの配列を読むこと（プライマーウォーキング法）もより安価にできる。逆にダイターミネーター法の欠点としてシグナル強度が不揃いになりやすく、ダイプライマー法と比べて一度に読める配列が短くなる傾向が挙げられる。ダイターミネーターには大きな蛍光発色団がついているため、通常のジデオキシヌクレオチドと比べてDNAへの取り込み効率が鋳型配列によって変化しやすいためである。かつてはダイターミネーターはダイプライマーの半分程度の長さしか読めないとされていた。しかしこれはDNAポリメラーゼと標識色素の改良によって大きく改善され、現在では1,000塩基程度とダイプライマー法と比べても遜色のない性能になっている。

ダイターミネーター法による読み取りデータ（クロマトグラム）の例

自動化

自動のDNAシークエンサーには、一回の運転(ラン、またはバッチとも呼ばれる)で384サンプルを同時に流すことができ、それを一日あたり24回分実行できるものもある。このようなシステムでは電気泳動からクロマトグラムの出力に至るまで自動的に行われるようになっている。また出力されるクロマトグラムも大量であることから、クロマトグラムから精度の低い部分を除去するようなプログラムも商用・非商用を問わずに数多く存在している。これらのプログラムは各ピークに品質のスコア付けを行い、精度の低いピークについては除去する。こういったプログラムのアルゴリズムの正確さは人間が目で確認して処理するのに比べるとやや劣るが、しかしながら大量の配列データを自動的に処理するには十分なものとなっている。

質量分析

現状では100塩基以内しか読み取れないが、質量分析によって分離・検出することもできる。きわめて微量でも検出可能で、非常に高速である。各ピークの順番が塩基の順序に、ピーク間の距離がそれぞれの塩基の分子量に対応するため標識が不要で、ダイターミネーター法のように1回の反応で4種類の塩基を読み分けることができる。

修飾を受けた塩基が含まれている場合には効果が高い。

DNA合成を監視する方法

DNAポリメラーゼによる伸長反応を監視して配列を決定する方法が何種類か開発されている。実はサンガー法あるいはマクサム－ギルバート法の開発以前は、DNA合成によって放射性標識したデオキシリボヌクレオチドが取り込まれるかどうかをチェックすることで配列を決定していたので、より古い方法だといえる。

パイロシークエンシング

パイロシークエンスの例
ヌクレオチド	発光量
dATP	1
dGTP	0
dCTP	0
dTTP	1
dATP	0
dGTP	2
dCTP	1
dTTP	1

1980年代から開発が始まり、1990年代後半になってMostafa Ronaghiらが実用化した方法で、ヌクレオチドがDNAに取り込まれるときに放出されるピロリン酸をATPに変化させて発光反応に用いることで、ヌクレオチドがどれくらいDNAに取り込まれたかを定量できるという原理に基づいている。実際にはデオキシリボヌクレオチドを1種類ずつ加えて発光量を測定しては除去することを繰り返すことで、配列を決定する。

反応系には鋳型となる一本鎖DNAとプライマー、DNAポリメラーゼの他に、ATPスルフリラーゼ、ルシフェラーゼ、アデノシン5'-ホスホ硫酸 (APS)、ルシフェリンなどが必要である。

反応系にヌクレオチド（dATP・dGTP・dCTP・dTTPのいずれか1種類）を加える。
1. ヌクレオチドがDNAに取り込まれるとピロリン酸が生じる
2. ピロリン酸が、ATPスルフリラーゼによってアデノシン5'-ホスホ硫酸に付加されてATPが生じる
3. ATPとルシフェラーゼによりルシフェリンが発光する

発光量を測定する

余剰のヌクレオチドを除去する

以上をヌクレオチドの種類を変えながら繰り返す。例えば右表のような発光パターンであれば、そのDNA配列はATGGCTということになる。

最後の余剰ヌクレオチドの除去には、大きく分けて2通りの方法がある。一つは固相法で、鋳型のDNAを何らかの固相の基質に結合させておき、反応液を洗い流して除去する方法である。もう一つは液相法で、アピラーゼを加えてヌクレオチドを分解する方法である。

現状では1度に数十塩基から100塩基程度しか決定できないが、比較的低コストで配列を決定できるために一塩基多型 (SNP) 解析などで使われている。特に2005年にこの原理を応用した大規模シークエンサーが454ライフサイエンス社から発売され、サンガー法の10分の1のコストで大量の配列決定ができるとして注目を集めている。

DNA分解を監視する方法

1990年代から、逆にDNA分子を端から1塩基ずつ分解していき、その過程を監視する方法が考えられている。4種類のデオキシリボヌクレオチドをそれぞれ蛍光色素で標識しておき、さらにビオチン化プライマーを用いてDNAポリメラーゼで相補鎖を合成させる。その後何らかの固相の基質に合成した相補鎖を固定しておき、水流のなかで3'-5'エキソヌクレアーゼにより相補鎖を分解させる。すると水流中に順番に蛍光標識されたヌクレオチドが流れてくるので、これを検出することで配列を決定するという方法である。この方法は毎秒100〜1,000塩基という非常に高速な配列決定が可能だと考えられるが、実用化にはまだまだ遠い状況である。

ハイブリダイゼーションを利用する方法

顕微鏡による方法

歴史

1953年 DNAの二重らせん構造の発見

1972年リコンビナントDNAの技術が開発された。これ以前はバクテリオファージかウイルスのDNAしかDNAシークエンシングのサンプルには使えなかった。

1975年最初の完全なゲノム配列としてバクテリオファージφX174の全ゲノムが解読された。

1977年マキサムとギルバートによる"DNA sequencing by chemical degradation"(分解によるシークエンシング:化学分解法)が発表された。サンガーはこれとは別に"DNA sequencing by enzymatic synthesis"(合成によるDNAシークエンシング:酵素法)を発表した。

1980年サンガーとギルバートがノーベル化学賞受賞

1986年カリフォルニア工科大のLeroy E. Hoodの研究室とスミスが半自動のDNAシークエンサーを発表

1987年アプライドバイオシステムズ社が世界初の自動DNAシークエンサーABI 370を発売。

1995年 Richard Mathies らが蛍光色素によるシークエンシング技術を発表。

1998年ワシントン大のPhil Green と Brent Ewing が配列解析ソフトphredを発表。

参考文献

Lilian T. C. França, Emanuel Carrilho, and Tarso B. L. Kist (2002). “A review of DNA sequencing techniques”. Quarterly Reviews of Biophysics 35 (2): 169-200.

^
F. Sanger and A. R. Coulson (1975). “A rapid method for determining sequences in DNA by primed synthesis with DNA polymerase”. Journal of Molecular Biology 94 (3): 441-446.

^
F. Sanger, S. Nicklen, and A. R. Coulson (1977). “DNA Sequencing with Chain-Terminating Inhibitors”. Proceedings of the National Academy of Sciences, USA 74 (12): 5463-5467.

^
Allan M. Maxam and Walter Gilbert (1977). “A New Method for Sequencing DNA”. Proceedings of the National Academy of Sciences, USA 74 (2): 560-564.

外部リンク

研究会

NGS現場の会

その他

NGS Sufer's Wiki

[1] 
F. Sanger and A. R. Coulson (1975). “A rapid method for determining sequences in DNA by primed synthesis with DNA polymerase”. Journal of Molecular Biology 94 (3): 441-446.

[2] 
F. Sanger, S. Nicklen, and A. R. Coulson (1977). “DNA Sequencing with Chain-Terminating Inhibitors”. Proceedings of the National Academy of Sciences, USA 74 (12): 5463-5467.

[3] 
Allan M. Maxam and Walter Gilbert (1977). “A New Method for Sequencing DNA”. Proceedings of the National Academy of Sciences, USA 74 (2): 560-564.

搜尋此網誌