【結論|DNA配列はA・T・G・Cの並び】
DNA配列とは、A・T・G・Cが並んだ“文字列”です。
そして、その長さを表す単位がbp(ベースペア)です。
生物ごとの特徴の違いは、DNAが持つ塩基配列の違いによって生まれます。
DNAの情報を表している部分を、塩基(base)と呼びます。
DNAには、
- A(アデニン)
- T(チミン)
- G(グアニン)
- C(シトシン)
の4種類があります。

配列(sequence)とは?
DNAのA・T・G・Cが並んだものを、配列(sequence)と呼びます。

例えば👇
5’ATGCTAGCTAGCTAGCTAGC 3’
これはDNA配列の一例です。
つまり、
配列 = DNAの文字列
ということです。
DNA配列には「向き」がある
DNA配列は、どちら向きでも同じではありません。
DNAには、
- 5’(ファイブプライム)
- 3’(スリープライム)
という“向き”があります。
実務では、配列は基本的に5’→3’方向で表記します。
最初は難しく感じますが、「DNAには向きがある」くらいの理解で大丈夫です。
bp(ベースペア)とは何か
DNAは、2本の鎖が向かい合ってできています。
AはTと、GはCと対になって結合しており、これを塩基対(base pair)と呼びます。
DNAの長さは、この塩基対の数で表され、単位としてbp(base pair)が使われます。

例えば、上のイラストでは塩基のペアが4組あるので、4 bpです。
実務では「長さ感覚」が重要
研究や検査では、DNAの長さをよく扱います。
例えば👇
- 300 bp → 比較的短いPCRでよく見るサイズ
- 1000 bp → 少し長め
- 10000 bp → PCRとしてはかなり長い
このように、bpを見るとDNAのサイズ感が分かるようになります。
DNAは体の中にある物質
そもそもDNAは、私たちの細胞の中に存在する物質です。
多くの細胞では、DNAは核(nucleus)と呼ばれる場所の中に入っています。
(※ミトコンドリアDNAなど、一部例外もあります)
DNAは普段はゆるく折りたたまれて存在しており、細胞分裂の時には、
染色体として強く凝縮した形になります。

そのため、DNAを抽出するということは、細胞の中からDNAという物質を取り出すということです。
DNAは正式には、デオキシリボ核酸(Deoxyribonucleic acid)と呼ばれます。
DNAの構造|ヌクレオチドとは?
DNAは、ヌクレオチドがたくさんつながってできています。
ヌクレオチドとは、DNAを作る材料の基本単位です。
「塩基・糖・リン酸」がセットになった構造をしており、
塩基の種類によってA・T・G・Cが決まります。

実際の実務ではどう使われる?
各生物の塩基配列は、BOLDやBLASTといったサイトに登録されています。
BLASTとは、DNA配列を世界中の登録配列と照合できる検索ツールです。
また、BOLDはDNAバーコーディング用の配列データベースです。
実際の実務では、これらの配列データと、自分が抽出したDNA配列を照らし合わせて、
- 生物種の同定
- 遺伝子の確認
- プライマー設計
などに利用されています。
また、DNA配列は5’→3’方向で表記されることが多く、文字数も非常に長いため、長いDNA配列では、配列を全部読むというより、「位置(座標)」で扱うことが多くなります。
例えば👇
- 100 bp付近
- 500 bp付近
- この遺伝子のこの部分のように考えることが多くなります。
遺伝子には名前がある
DNA配列の中には、それぞれ役割を持つ領域があります。
これを、遺伝子(gene)と呼びます。
そして、それぞれの遺伝子には名前があります。
例えば👇
- COI(ミトコンドリア遺伝子)
- ACTB(βアクチン)
- TP53(がん抑制遺伝子)
などです。
同じ種でも少しずつ違う
ヒトならヒト、イヌならイヌのように、同じ種ではDNA配列はほぼ同じです。
ただし、完全に同じではなく、少しずつ違い(変異)があります。
このわずかな違いが、
- 品種の違い
- 個人差
- 病気に関連する変異
などの解析に利用されることがあります。
種が違うと配列も違う
ヒトと魚、ヒトと細菌のように種が違うとDNA配列も大きく異なります。
この違いを利用して、どの生物かをDNAで判定することができます。
これを、DNAバーコーディングと呼びます。
まとめ
- 配列 = A/T/G/Cの並び
- bp = DNAの長さの単位
- DNAは2本鎖でできている
- DNAには5’→3’の向きがある
- 長い配列は「位置(座標)」で扱うことが多い
- 同じ種では配列はほぼ同じ
最後に
正直、私も最初は、「1 bpって何?」というレベルでした。
でも理解すると、「DNAは文字列と長さの話なんだ」と分かってきます。
ここを超えると、PCRやプライマーの理解もかなり楽になります。
