連鎖

同一染色体上にあるサイトは、連鎖 (linkage) が生じることがある。二つのサイトが連鎖する場合、該当サイトにおける特定のアレルの組み合わせのパターンが多く観測される。しかし、二倍体あるいはそれ以上の倍数体生物では、減数分裂時の組み換えにより、連鎖が解消され、特定のパターンがみられなくなる可能性もある。

いま、同じ染色体上で互いに近い位置にあるサイト 1 および 2 に突然変異が起こる場合を考える。サイト 1 では突然変異により A が a に変化し、同時にサイト 2 では突然変異により B が b に変化したと仮定する。サイト 1 およびサイト 2 が連鎖しかつ組み換えがなければ、その子孫において同じ染色体上に AB または ab のパターンが多くみられる。次に、もしサイト 1 とサイト 2 の間に組み換えが起きたと考えると、AB および ab のパターン以外に、Ab および aB のパターンも現れる。このとき、連鎖が解消されたといえる。なお、同じ染色体上にあるアレルの組み合わせ(AB、ab、Ab および aB)のことをハプロタイプとよぶ。

サイト 1 とサイト 2 が連鎖しているならば AB または ab のハプロタイプが多く、a の存在と b の存在が互いに相関する(a が存在すれば b も存在するし、逆に a がなければ b もない)。逆に、サイト 1 とサイト 2 が連鎖していなければ(連鎖が解消されているならば)AB および ab の他に Ab と aB のハプロタイプもみられるようになり、a と b の存在が互いに相関しなくなる。このような状態を連鎖平衡 (linkage equilibrium) という。連鎖平衡から予想される期待値と、実際の観測値との違いを、連鎖不平衡 (linkage disequilibrium; LD) 量という。AA、Ab、aB、ab のハプロタイプ頻度をそれぞれ pAA、pAb、paB、pab とおくと、連鎖不平衡量 D は次のように定義される。

\[ p_{AB} = p_{A}p_{B} + D \\ p_{Ab} = p_{A}p_{b} - D \\ p_{aB} = p_{a}p_{B} - D \\ p_{ab} = p_{a}p_{b} + D \]

D を次のように表すことができる。

\[ D = p_{AB}p_{ab} - p_{Ab}p_{aB} \]

アレル A と B を 0、a と b を 1 と数値化したあとに、ピアソン相関係数を求めることができる。このとき、相関係数と連鎖不平衡量 D は次のような関係が見られる。

\[ R^{2} = \frac{D^{2}}{p_{A}p_{a}p_{B}p_{b}} \]