ミトコンドリアDNA分析について

Nifty歴史フォーラム縄文会議室で展開されたミトコンドリアDNA分析に関する議論から、早傘の発言を抜き出しました


01955/01955 HFC03726 早傘 RE:Re:縄文人の渡来
(14) 00/08/02 21:48 01950へのコメント

半月城さん、MAKOTO.Sさん、大三元さん こんばんは

マルチレスにて失礼します。

この手の話題にはどうしてもしゃしゃり出てきてしまいます

なお以下の記述で用いるデータは主に「DNA人類進化学」(宝来聡 1997 岩波科学ライブラリー52 \1000)に基づくものです。

(RE1935 半月城さん)
;いずれにせよ、両者(アイヌと沖縄)のDNA配列における距離が、アイヌと
;クスコの住民より遠いとは、事実は小説より奇なりです。

根拠はなんでしょうか? 勘違いはありませんか?


(RE1944 MAKOTO.Sさん)
;3文字位異なっていても同じ人種といえるというある程度の幅があるもの
;ということでよいのでしょうか?

まず確認しておきたいのは、話題となっているデータは、ミトコンドリアDNAのうち、D領域と呼ばれる、遺伝子情報が所在しないを部分を分析対象とし、塩基数(文字数)は約500文字。そのうち何文字違うかということなんです。
 そして、これが大事なことですが、集団間の遺伝距離と個人間の遺伝距離はまったく別のものです。個人対個人の比較で、異なる文字数の一つや二つは偶然の所産なんです。一方、集団間の距離では僅かな距離の違いに意味があります。
 さて、説明を簡単にするために古典的な3人種を仮に用います。
 主な居住地域によりアフリカ人、ヨーロッパ人、アジア人と呼ぶことにします。

 前掲書P101,P113-114から、集団内の塩基多様度(集団内での、個人同士の異なる文字数の平均値を、分析した全文字数で割ったもの)は

東アジア人1.3%(本土日本人1.3%) ヨーロッパ人 1.0% アフリカ人 2.1% であり、

文字数約500を掛けて

東アジア人約7文字(本土日本人も) ヨーロッパ人 5字 アフリカ人 10字

が、各集団内の個体間距離の平均値ということになる。これはあくまで平均だから、組合せにより0のこともあれば、何倍も離れていることもある。

; では逆に明らかに異なる人種である場合のDNA配列はどの程度異なるの
;でしょうか。

ここが一番混乱しやすいところなんですが、

集団間の系譜は、まあ、こんな感じ

 ─┬───────アフリカ人
   └┬──────アジア人
   └──────ヨーロッパ人

しかし、個人単位の系譜を作ると複雑。

なぜなら、まずアフリカでバラエティーを持った集団となったのちにその集団の一部が、特定の母系に片寄らずに分離すると、こんな感じ。

    このころ集団が分離
      ↓
 ─┬┬──┬──A1
   ││  └──B1
  │└┬────B2
   │ └┬┬──A2
  │  │└──B3
  │  └───A3
   └┬─────A4
    └┬────B4
    └────B5

 この時点では、集団Aに属する個人とBに属する個人の距離は、集団内の距離と変らない。
このあと、ほぼB4の子孫のみからなる集団が他地域に進出した場合(あるいは、偶然B4以外の子孫が激減した場合。いずれも小さい集団の場合に生じやすい現象)

 ─┬┬──┬───┬A1
  ││  │   └A1'
   ││  └──┬─B1
   ││     └─B1'
  │└┬──────B2
   │ └┬┬──┬─A2
  │  ││  └─A2'
  │  │└────B3
  │  └─────A3
   └┬───────A4
    └┬────┬─B4
    │    └─C
    └──────B5

この場合、Cに属する個人は、同じ集団内の個人との距離は小さく、集団外の個人との距離は大きい。逆にAやBに属する個人は、他の個人が同一集団に属するかいなかを距離によって判別することは不可能。


(RE 1945 半月城さん)
;アイヌとアンデス山脈に住む人が、限られたデーターの範囲とはいえ、
;地球上で一番近いなんて奇想天外です。縄文人を世界的なスケールでと
;らえる発想があらためて必要なようです。

2文字違えば十分遠いです。そもそも、番組の演出の都合で、できるだけ近い関係を探した結果がこの程度の距離だったということも考えられます。
ここで縄文人を持出すのは不適切といえます。

(RE 1947 半月城さん)

;この文章を引用された Tommyさんは、宝来教授のデーターを無作為に抽出し、
;東アジア「4民族」のDNA配列における塩基文字の違いを「遺伝的距離」と
;して図示しました。

「無作為抽出」といえば普通はある程度の数を抽出したと受け取れますが、御紹介のページを見たところ、1個体だけを抽出しているようです。上に述べたとおり一個人で集団を代表することは出来ません。Tommyさんの作業は根本的な誤解に基づくものというほかありません。


(RE 1950 大三元さん)
;どうやら平均12、000年で一文字変わるらしい。それって、しかし、何人、
;何万人いても同じなんだろうか、というのが良く判らないんです。

前掲書の P71 を御覧ください。

“Dループ領域の置換速度を7.00×10のマイナス8乗(/座位/年)と推定した”

これが一番基本の数値です。この数値を出す大本の根拠が少し怪しいのですが、桁が違うほどの大きな違いはないでしょう。約500座位当りにすると
3500/10^8=3.5/10万=1/2.8万 すなわち、同一母系を追うと、平均して2.8万年に1回、文字が変化する。2人のペアに注目すると、その半分の1.4万年に1文字、どちらかが変ることが期待されるとうことになります。ただし、これは定期的なものではなくまったくの偶然なので、少し計算してみると、1.4万年間の変化発生数は 0字:37%、1字:37%、2字:18%、3字以上:8%となります。
 発生頻度はこのように1系統に注目した場合ですから、人口とは無縁です。
 全集団での発生数は人口に比例しますが(およそ1000人の出産で1回)それが分析サンプルに含まれる確率は逆に人口に反比例します。

;もう一つ判らないのは、同じ場所での変位が独立に(例:アフリカとアジアで)
;(時は違うだろうが)起こる、ってことへの配慮はどうなってんだろう、っての
;も良く判らない。

偶然そういう変異が生ずる可能性は0ではありませんが、集団間の関係を見る場合には無視できる程度です。というのは、問題とする時間範囲(10数万年)では文字の変化が500文字の中で重複する可能性は十分低いからです。

;日本人サンプルでアフリカ人サンプルと同じクラスターに入っている例があるが、
;それはどう理解すべきなんだろう。(馬蹄型の図から一番近い例を見ると、12、
;000年前に分離したかに見えるものがある。)

日本人サンプルと東南アジア人を主とするクラスターにアフリカ人のサンプルが1人混じっていることをさされているのかと思います。この方がどこの国の出身かは不明ですが、数十人分析すればその中に一人ぐらいは、母系を溯るとアジア出身の人がいても不自然ではないと思われます。歴史時代にはインド洋交易が盛んでしたし、マダガスカルの住民はマレー系ですし(DNAでどうかは知りませんが)。


早傘

01960/01960 HFC03726 早傘 RE:Re:RE:Re:縄文人の渡来
00/08/04 07:40 01959へのコメント

大三元さん おはようございます

突然変異の原因は(狭義の)宇宙線だけではない。紫外線も、化学物質もあるいは、単なる転写ミスも原因となりえます。それらを含めて、あらゆる細胞に、それぞれの部位の危険性に応じた比率で突然変異が生じ得ると。
これは実のところかなり頻繁に発生しています。しかし、細胞の中には、DNAを修復する機能もあり、一生懸命働いていると。それでもなお、見逃されるものがあると。

;そうだとすると、その書き換わりってのは60兆個の内の一つに過ぎないん
;ですよね。命中した個体の全身が書き換わってしまう(らしい?)のは
;どういうメカニズムなんでしょう。。。

60兆個の細胞を全部ばらばらにして分析すれば、ミトコンドリアDループに限っても数え切れないほどの突然変異が生じているはずです。しかし、ある体細胞に突然変異が生じたとしても、その細胞が分裂してできた細胞にしか伝わらず、全身が書き換わることはありえません(たまたま、その細胞達のみがDNA検査の対象になれば、あたかもその個体はすべてそのDNAパターンで構成されるように見えますが、これはよほどの偶然)。

じゃあなんで、個体による違いが生じ得るか。それは卵子または、その元になる卵母細胞や卵源細胞に変異が生じた場合、その卵子から生じた子は、すべての細胞にその変異を持つことになるわけです。

まとめると、
1 体細胞に生じた変異が伝わるのはその個体のごく一部のみ。
2 女性の生殖細胞(またはその元になる細胞)に生じた変異はその子に伝わる。
3 その子は、母や姉妹兄弟とことなったDNAを持つ。
4 変異卵から生じた子が男性の場合は、その個体限り。


早傘

01967/01968 HFC03726 早傘 RE:アイヌと琉球人
(14) 00/08/06 13:52 01961へのコメント

半月城さんこんにちは

;宝来教授は現代アイヌと琉球人の関係をかなり遠いものとみているのも事実
;です。

「事実」とは思えませんが。宝来氏が「かなり遠い」と表現していますか?

;アイヌ(51人)と琉球人(50人)では、大三元さんが書かれたように
;「最も近い物(者)で一つの塩基が違っている」ようですが、両者の塩基配
;列の違いは平均すると一つどころか、かなり大きいのかもしれません。

もちろんそうです。

;同じ本土日本人(62人)でも早傘さんの引用 (#1955)によれば、塩基配列
;は平均で7文字くらいちがっているので、アイヌと琉球人とでは平均でそれ
;以上ちがいます。

根拠となるデータがありますか? 集団間の距離と、塩基配列の違いの平均は異なる概念です。アイヌと琉球人の個体の組み合わせの平均距離は6前後ということもありえます。

;NHKは両者で一番近いものを選んだのでしょうが、調査できた縄文人骨5
;体のうち1体(=現代アイヌのひとりと同じ配列)と、58体のアンデスミ
;イラのうち12体(=ラウルさんと同じ配列)との塩基配列の違いはたった
;2文字とのことでした。

戸田縄文人骨の配列があるアイヌ(アイヌA)と同じであることと、ラウルさん及びアンデスミイラ 12 体から、最も近い既存データがあるアイヌ(アイヌB)であり異なり字数は2文字であることは、知られていますが、アイヌAとアイヌBが同一とは、聞いたこともありません。

前回強調したように、個人間の関係と集団間の関係は別の概念です。半月城さんは「アイヌ」というだけですべて一緒くたにしているようですね。

;そのうえNHKは、世界中のサンプル「 27,000 人のうち、ラウルさんに最
;も近いのが、縄文を受け継ぐアイヌ」と解説していました。

「アイヌ」ではなく「あるアイヌ」と表現するのが正しいですね。
 ごく当たり前の話として、“Aから一番近いのがB”から、BとCの距離がAとBの距離より遠いということはいえません。
 「仙台に最も近い大都市は東京です」といえたとしても逆に東京から近い順に大都市を並べたら、仙台は川崎・横浜・千葉よりあとで名古屋とどっちが近いかというあたりでしょう。

;こうした背景から、私は「いずれにせよ、両者(アイヌと沖縄)のDNA配列
;における距離が、アイヌとクスコの住民より遠いとは、事実は小説より奇な
;り」と書きました。勘違いしているとは思えません。

すでに大三元さんのレスがあるとおり、もし距離を、最も近い組み合わせの異なり文字数で計るならば(この方法は適切ではないと考えていますが)

 (アンデス:アイヌ)=2  (アイヌ:琉球)=1

であることは、あなた自身が認めていることです。指摘されれば間違いに気づくのが「勘違い」だとすれば、「勘違い」どころじゃないようですね(^^;)。

;遺伝的距離の図として、前回 Tommy さんのサイトを紹介しましたが、このサ
;イトは、同氏のおことわりにあるように学問的に厳密ではありません。

厳密かいなかではなく、根本的に誤解しているといっているのです。
日・韓・ア・中、各集団から一人ずつ出鱈目に選んだ場合、下のようになることは十分あり得る

(某日:某韓)=7 (某日:某ア)=4 (某日:某中)=0
(某韓:某ア)=6 (某韓:某中)=7 (某ア:某中)=4

 これによって宝来氏の説は間違いと主張しても、何の意味もありません。
 同様に、たまたま運良く、集団間の距離に沿うような形の選択になっても、それには何ら、宝来氏の説を裏付ける意義はないということです。

 何度もくりかえしますが、1個人の例で集団の性質は決まらない。

 これって、差別問題を少しでも考えたことがある人なら、頭に染み込んだ常識になっているはずなんですが。

; 学問的には宝来教授の図があります。それによると、本土日本人とアフリ
;カ人との遺伝距離(千分比)をめのこで130として、本土日本人と韓国人
;とはゼロ、すなわちミトコンドリア遺伝子レベルで同じ集団、琉球人とは1
;5,中国人とは25,アイヌとは30と示されました(注)。
; ただ、残念なことにアイヌと琉球人との距離は示されませんでした。

さて、問題の図はこういう形です(「DNA人類進化学」P116)

  +---------------------------------------------------- アフリカ人
─+           +---------------------------------------- ヨーロッパ人
  +-----------+       +-------------------------------- アメリカ先住民
              +-------+                 +-------------- アイヌ
                      +-----------------+ +------------ 中国人
                                        +-+     +------ 琉球人
                                          +-----+     | 韓国人
      0                   0.05                  +-----| 本土日本人
      └─────────┘                          

この図は単位が明確ではないのですが、%ではないかと思っています。つまり、グラフで 0.13 の長さは 0.13% の意味かも知れません。この辺は調べてみないと確実なことがいえませんが、元々が%表示の場合、それを千倍して千分比というわけにはいかなくなります。よって、以下では元の図の数値によって記述します。

この図は、本土日本人とそれぞれの集団の距離を示したものではありません。
本土日本人と韓国人の距離は 0 、両者を合わせた集団と琉球人の距離は0.015、以上を合わせた集団と中国人の距離は 0.025 という風に読むものです。それでもあえて本土日本人とアイヌの距離が 30 と表現するならば、アイヌと琉球人の距離も 30 です。
 前掲書P115には個々の集団間の距離のグラフも載っています。それを見ると(グラフが低くて計りにくいのですが)

 (本土日本人:琉球人)=0.02前後 (本土日本人:アイヌ)=0.03強 (アイヌ:琉球人)=0.06弱

となっています。

しかしまあ、上記の図が手元にあるならば、「アメリカ先住民」がアイヌと相当離れていることはわかるはずなんだが。アンデスの先住民は他のアメリカ先住民と異なる起源だとでも思っているのでしょうか?

                        早傘


01969/01969 HFC03726 早傘 RE:Re:RE:Re:縄文人の渡来
00/08/06 13:54 01964へのコメント

大三元さん まいどっ 1966へもまとめてレスします

(re 1964)
;ここで一つ:2人のペアに注目すると確かに半分の期間になる。しからば
;同一母系にもっと多数が居たらどうなる、やはり人数分の1の期間で変異が
;期待できるのではないか。それに対して、

集団内の変異の発生総数が多くても、それは個々人にとっては関係ないのですよ。ペアの場合は半分というのは、距離が、2人の組み合わせによって計算されるからです。

日本では毎年数十万人の子供が産まれている。ということは、年に数百人、1日に一人強の、親と違う塩基配列の子供が産まれている。だからといって、それが、その数のまま、あるペアの遺伝距離には影響しない。

(re 1964)
;突然変異が起こってるかも知れないが
;サンプルに含まれなかったから「無い」と言ってることになりませんか。

サンプルに含まれなければ「無い」のは当然です。
まあ、それでは混乱するだけかもしれませんので、別の説明をしましょう。

人口n人の集団で、1/28000(/年/人)の比率で突然変異が発生するとします。

突然変異の発生頻度は n/28000

一方、一つの突然変異がその集団内の個体同士の平均距離におよぼす影響は、

(変異個体と他の個体の組み合わせ)/(n人から2人を選ぶ組み合わせ)
= (n-1) / {n*(n-1)/2} = 2/n

両者を掛け合わせたものが、集団内での平均個体間距離の増加率

(n/28000)*2/n = 1/14000(/年)

このように人口に関わらず一定

(re 1964)
;いずれにしても人類歴史の解明への凄い手法だと思う物のサンプル数が
;小さすぎますよね。

 サンプル数の問題はあります。特に、2つの集団の間で共通する配列が存在しないことからなにかを言おうとするならば、サンプル数の問題は避けて通れないはずなのに、その辺の配慮がされていないように感じます。
 琉球人とアイヌを全員分析すれば、同一の配列の組み合わせが見つかる可能性はかなり高いでしょう。それでも50サンプルに一つも同じ組合わせが無いことから、あるていどのことはいえます。ただしそれはクラスターで1文字の相違に相当する年数とは別だということです。

(re 1964)
;極く粗っぽく捉えて、10数万年で10文字替わるだろう、 10/500 =2%
;程度の確率で重複するかも知れない、って理解でいいでしょうか。

と、理解しています。変異率がすべての塩基で等しく、どの文字に変わる確率も等しいと仮定すると、個体Aと個体Bでa文字中b文字の差異がある場合、ある突然変異の、平均距離への寄与は以下のとおり

起こりうる変異の数 a*(4-1)=3a #塩基の種類は4

                 場合数   差異の増加
共通していた部分に発生      (a-b)*3     1
異なっていた部分に発生
 相手と異なる字へ変異       b*2      0
 相手と同じ字に変異                b*1     −1

1変異あたり増加期待値 = {3(a-b)-b}/3a = (3a-4b)/3a = 1 - 4/3*(b/a)

b/a が 2% であれば、一度の変異で 0.987 文字分の差異が増加すると期待できるというわけです。a/b が 3/4(75%)に近づくにつれ、差異の増加は頭打ちになります。また、そういったところまでいくと、差異の起こりやすい部位の有無が計算に影響しますから、差異数から変異の発生数あるいは同一祖先からの年代を計算することは困難になります。

(re 1964)
;「DNA人類進化学」P29図5でいえば、クラスターC5の下から9個体
;目と10個体目、です。遺伝距離が1/1000程度に読めますので分岐は5千年
;前かと。

このクラスター図の距離の単位の書き方は、全試料の塩基多様度 1.5% (=15/1000) が全体の長さになるように作図しているだけで、p88図20と1文字の差異の重みは同じです。そして1文字の差異は、グラフ上では1万年となりますが、個別の例では、そこまで年代を絞り込むことはできません。(後述)

(re 1964)
;大いにありそうなことではありますが宝来さんはアフリカ人がC1〜C5の
;すべてのクラスターに出現する事から、アフリカ人の塩基配列の多様性を
;解いているので、批判的に見る必要もあるけど、尊重もしたい。。。
;(つまり、アフリカ人サンプルにアジア母系が混入してるじゃん、とは
; あまり簡単に言っては失礼かな、、、、と。。。(^^))

C5クラスターに入っているだけならなんら不自然ではない。その中でも元に近い部分で分岐していれば、素直に受け入れるのだけれども、近すぎてちょっと不自然。

宝来氏は当然、サンプルの採取に当たって本人の知る限り遠く離れた地域からの婚入が母系にないことを確認していると思いますが、それでも伝承・記録でさかのぼれる以前の婚入の可能性は否定できないでしょう。もちろん、それ以外にもいくつもの可能性があります。

a そのアフリカ人サンプルと日本人サンプルに至る系列のみ、たまたま突然変異の発生が少なかった
b アフリカ人サンプルの系列に生じた変異がたまたま日本人サンプルの系列と 共通するものがほとんどだった

いずれも、偶然抜きには成立しない。多くのサンプルを集積すれば、解決に向かう可能性もありますが(分岐系統樹を描けばaの是非は判断できる)、しないかも知れない。それらに対して実は母系をたどるとアジア人かも知れないというのも十分可能性があるという考えです。

(re 1966)
;「個人対個人の比較で、異なる文字数の一つや二つは偶然の所産なんです。」
;という所ですが、それって偶然なんですか。彼らは1〜2万年前まで遡れば
;同一の母系から出自した、ってことになるんじゃないですか。

そういう意味ではなくてですね、分岐してからある年代が経過したとして、計算上予想される文字数の違いが2文字だとしても、実際には0かもしれないし3かもしれない。逆に言えば、ある人から見てabcの各個人が異なる文字数0,1,2字だとしても、そこから、母系の分岐が c b a の順とは限らない。
aとは2万5年前に分かれ、bとは2万年前に分かれ、cとは1万5千年たということもありえる。
 つまり、個別の事例では、異なる文字数からいえることは限られているんです。
4万前に分岐したとしても1文字しか違わない可能性が結構ある。

分岐後年数ごとの異なり文字数の変化
  年      0       1       2       3      4以上
 2800   81.9%   16.4%    1.6%    0.1%    0.01%
 5600   67.0%   26.8%    5.4%    0.7%    0.1%
11200   44.9%   36.0%   14.4%    3.8%    0.9%
16800   30.1%   36.2%   21.7%    8.7%    3.4%
22400   20.2%   32.3%   25.9%   13.8%    7.9%
28000   13.5%   27.1%   27.1%   18.1%   14.3%
42000    5.0%   14.9%   22.4%   22.4%   35.3%
56000    1.8%    7.3%   14.7%   19.5%   56.7%
70000    0.7%    3.4%    8.4%   14.0%   73.5%

文字数1になる確率をもう少し細かく1400年ごとに計算し、集計すると、厳密ではないのですが、任意のペアが1文字の違いだった場合、推定される分岐年代は

 7千年以内 約10% 5万年以上 約10% 6万年以上約5% 7万6千年以上 約1%あるいは
 12600年以下 25%  12600-36000年 50%  36000以上 25%

となります。

なお、以上の計算は 三四郎 (^^; で行いました。

                   早傘

01970/01970 HFC03726 早傘 RE:Re:RE:Re:縄文人の渡来00/08/06 20:23 01969へのコメント

読み直して間違い発見 (^^;

;1変異あたり増加期待値 = {3(a-b)-b}/3a = (3a-4b)/3a = 1 - 4/3*(b/a)
;b/a が 2% であれば、一度の変異で 0.987 文字分の差異が増加すると期待できる

1-4/3*0.02 = 0.9733333333333333333333333333333333333333(以下省略) ですね。

当初、上の式の係数が 2/3 に間違っていて、式の方は訂正したんだけど、計算例の修正を忘れていました。

 ミトコンドリア・イブに関しては FSCI の生物学の部屋に勉強になるツリーがあります。

 また、この会議室の読者のほとんどは、あらためて紹介しなくとも読んでいると思いますが、日本史館古代史会議室でもしばらく前にミトコンドリアDNAに関するツリーが育ち、精力的な議論がされています(#3316)

   早傘

01972/01972 HFC03726 早傘 RE:Re:RE:Re:縄文人の渡来
00/08/09 21:54 01971へのコメント

大三元さん こんばんは

1969は大三元さんへの反論というよりも、いろいろ計算してみた結果が結構興味深いものだったので(たとえば、28000年経過時の予想異なり字数があんなにばらつくとは思わなかった)、調子にのってアップしてしまいました。もっと簡潔なレスにすべきだったと反省しています。

宝来氏の研究については、僕も理解できていない部分があるし、誤解している部分もあるはずです。大三元さんとの議論の中で、その辺を確認していきたいと思っています。

早期の復帰をお待ちします (^_^)

   早傘

01976/01977 HFC03726 早傘 RE:アイヌとアンデス先住民
00/08/13 15:14 01973へのコメント

半月城 こんばんは

何度でもくりかえすけれども

 個人間の関係と集団間の関係は別の概念です。

さて、アメリカ先住民の中でアンデスの先住民が特別にアイヌひいては縄紋人に近いという主張に到達されたようですね。その論拠を検証しましょう

1田島氏の発言
;  コロンビアでもとくにわれわれが興味をもったのはアンデスで、現地の人
;びとの顔を見た最初の印象が、「これはもうわれわれ日本人と兄弟じゃない
;か」ということです。

これはアメリカ先住民全てを見比べての印象ではなく、コロンビアの中で欧州系や混血系が多い都市部に比べ、より純粋な先住民の残るアンデスでそういう印象を得たというだけの話。USAに行ったならば、先住民居留区に行ったときにそういう印象を持ったことでしょう。
なお、宝来氏の「アメリカ先住民」のデータのほとんどはコロンビアとチリで収集されたものであることは「DNA人類進化学」(以後"宝来本"と呼ぶ)を読めば明白。両国とも、先住民の主な居住地はアンデスです (^^;

2a
;アンデスといっても広大で、その住民はもちろん一様ではありません。そうし
;たなかで、とりわけアイヌに近かったのがクスコの住民だったようです。
2b
; 前にも書いたように、NHKによれば世界中のサンプル「 27,000 人のうち、
;ラウルさんに最も近いのが、縄文を受け継ぐアイヌ」ということになります。

1967 に書いたとおり、2bは2aの根拠になりません


;この結論にたいして早傘さんは<「アイヌ」ではなく「あるアイヌ」と表現
;するのが正しいですね>と書かれましたが、この意図は、暗に「あるアイヌ」
;はかなり特殊例かもしれないと疑ってるからでしょうか?
;もし、NHKが平均からかけ離れたアイヌをことさらとりあげ、そこから
;上記の結論をだしているのでしたら詐欺まがいですが、宝来教授も出演してい
;る番組でもあるし、私はそうでないと素直に信じます。

なんどでも繰り返します。

 個人間の関係と集団間の関係は別の概念です。

そのアイヌが"特殊"か"平均"かという発想が出る時点で、根本的にずれています。
集団内の多様性についてまったく理解できていない。

なお、僕が宝来氏の立場であったとしても別にNHKに文句は言わないよ。
NHKは、琉球人よりアンデスの住民の方がアイヌに近いとは言っていないもの。


;もしアイヌとアンデス先住民が近いとしたら、このパレオインディアンこそ
;がカギをにぎっているのかもしれません。

 あなたの考えでは、アンデスの先住民よりも他のアメリカ先住民のほうが、早く分岐したことになるはずなんですが、その人々はいつアメリカ大陸に渡ったというのでしょうか。
 そもそも、あなたの考えのとおりアイヌ=縄文人で、そのアイヌ=縄文人とアンデス先住民の分離が1万2千年前よりあとなら、すでに縄文時代に入っているのだから、

;それ以外には縄文人のアンデス移住説を持ちだすしかなさそうですが、私はパス
;します。

なんて言えないんですが。

 まあ、とにかく、あなたが引用された文献それぞれを、十分時間をかけてお読み下さい。それぞれの著者の論述の中から、文脈を無視して適当な語句を切り抜いて、矛盾だらけのレスを返されても困惑するばかりです。

半月城さんにとって「勘違い」という言葉に、よほど大きなマイナスイメージがあるのでしょうか。

   早傘


01977/01977 HFC03726 早傘 RE:Re:RE:Re:RE:Re:縄文人の渡来
00/08/13 15:14 01974へのコメント

こんばんは 大三元さん

集団間での最短距離になる組合せから、集団の分離した時期を計算する場合、サンプル数と、各集団(または想定される祖先集団)の多様性がからみます。

集団Aと集団Bを比較するとします。分離した時点で、両集団とも、タイプ1からタイプ100までの100種類のタイプを1%ずつ含んでいたとします。

この場合、

<ワークシートの準備>

サンプルが各 10 人ならば、分離直後でも、同タイプが含まれない可能性が

<計算中>

約36%もあります。

サンプルが各15人ならば、

<計算中>

<計算中>

その可能性は10%です。

サンプルが各20人ならば、

<計算中>

<計算中>

<計算中>

<計算中>

その可能性はわずか1.9%です。

サンプルが15人でも、タイプが200種類ならば

<計算中>

<計算中>

<計算中>

<計算中>

<計算中>

<計算中>


同タイプのペアを含まない可能性が32% となります。

 このように、多様性とサンプル数により、同タイプの含まれる可能性が変る。 当然、期待される同タイプペアの数の分布も変わる。多様性に対してサンプル数が十分大きくないと、いけないというわけです。多様性がどのていどならサンプル数を何人以上とか、平均何組の同タイプペアが期待できるとかまでは計算し切れません(ランダム・シミュレーションをすればいいのだろうけれども、やりきれません)

以上は前置き。ここからが本番。

 さて、人類集団の間で相関を見た場合、分離時には祖先が同一タイプであったペアがサンプル中にn組いたとしよう。ところがこれが、分離後の変異によりすべて1文字以上の違いになっているとする。nが判明した場合、分離してからの年数はどの程度と見積もれるか?

 それぞれのペアが1人対1人の場合、どちらかに変異が起これば同タイプでなくなる。これは、常に一定の確率で起こる現象であるから、炭素年代測定と同様に半減期の概念を導入できる。半減期は約9700年。すなわち、9700年ごとに同一タイプのペアが半減すると考えてよい。もしnが8ならば、9700*3=約29000年後に1組残っていることが期待できる。もちろん2組のこっているかもしれないし、0組かもしれない。4万年たっていれば期待数は0.5を割っているから、分離からの年数は4万年以上と推測するのが堅実だろう。

 nが1の場合のみに限って、個人の場合の計算法を適用できる。すなわち、1文字違いなら平均1万4千年、ただし、6千年以内の確率が約1/3もある。

 さて、nは何組であろうか? それは上に見たようにサンプル数や集団の多様度、サンプルが集団をうまく代表しているかによってぶらつく。

 このように、分離してからの年数を、最短距離のペアの異なり字数から計算するのは危険と考えます。


長くなったので続きは別レスで 早傘


01978/01979 HFC03726 早傘 RE:Re:RE:Re:RE:Re:縄文人の渡来
00/08/13 16:33 01977へのコメント

こんばんは 大三元さん 1974へのレスの続きです

;「起こり得る」とは、サンプル個体の子孫で、という意味ですか?
;既にa文字中b文字に差異がある、という前提なので、そこから更に
;「起こり得る」ものを考えるのか、サンプル個体の先祖の時には共通
;だったが、サンプル個体に至る間に変位し得たものの数ですか?

想定している系列のペアに、次に起こる変異です。

;だから個体aとbのミトコンドリアDループ約500文字に対して10文字
;違っているとすると(2%)それは11回か12回の変異が起こって居た筈、って
;意味ですね?(だとしても、これの意義(重要さ)が良く判らない。)

11回変異が起こったとすると、10.85文字異なることが期待できる。20回でも19.5文字の差が期待できる。すなわち、変異が同一部位で重複している可能性は低い。
特に、特定のペアで、複数回、変異部位が重なることはまず考えられない。したがって、距離が1しかないことを同一部位での変異が繰り返されたと説明することは難しい。

;チンパンジィとヒトの分離がミトコンドリアDNAの全塩基配列を比較した
;結果、約490万年前、とされていますが(P60)この程度の年代なら
;「差異数から、同一祖先からの年代を計算する事」はまだ困難にならないん
;ですね

Dループの変異速度は 7/10^8/座位/年だから、7%/百万年。
これは祖先に対してだから、子孫同士の距離はこの2倍の早さで開く。
すなわち、14%/百万年。3百万年たてば 42% 。このくらいまで変異が蓄積されると、もはや、時計としては使いにくい。


;やはりサンプル数がまだ少ないからでしょうか。

確率計算上こうなるということで、サンプル数とは無関係です。
というか、あくまで、個々のペアの距離に対する数値なので、サンプル数は関与しませんね。

;>>7千年以内 約10% 5万年以上 約10% 6万年以上約5% 7万6千年以上 約1%
;の合計が100%にならないので理解が止まっております。ご解説をm(_ _)m

単に手抜きで書いただけで、(^^; 丁寧に書けば(その後の計算結果も加え)

2千年以内 約 1%  2千年〜7万6千年 約98% 7万6千年以上 約 1%5千年以内 約 5%  5千年〜6万年 約90% 6万年以上 約 5%7千年以内 約10%  7千年〜5万 約80% 5万年以上 約10%


                       早傘


01979/01979 HFC03726 早傘 RE:変異速度・縄文人の渡来
00/08/13 16:33 01975へのコメント

ようやく最後だ

;座位って塩基のこと?

そう考えてかまいません。(微妙な違いはあるけど、正確に説明する自信がない)


;図5のR(ルーツ)は遺伝距離=14/1000と読み取る
;これはDループによるものだから約500X14/1000=7(単位は座位?塩基?数)
;これじゃぁRの年代は1億年になっちゃううう。どこを間違えてるんだろう?
;図5の横軸って「遺伝距離X1000」って書いてあるけど「万年」と読めば
;P72とも良く合うのではあるが。。。

  7/10^8(変異/座位/年)×X年=14/1000(変異/座位)

 なので、500座位を掛けるならば、両辺に掛けて

  35/10^6(変異/年)×X年=7(変異)

  X=7*10^6/35=20万年

これは共通祖先の年代にあらず。「塩基多様度は1.5%となった」(P28)を横軸としたものと思われます。塩基多様度はペアの距離だから、Xを半分にした約10万年が、試料とした個体の平均分岐年代ということで、はて、それを横軸にするのはいかがかと思う。そういう目で見ると、同じ形のグラフの横軸が、p88図20では%表記になっているのに注意されます。図5の横軸表記が誤解をまねきやすいので横軸の表記法を変えたものと推測します。

                     早傘


02042/02043 HFC03726 早傘 RE:宝来本を正しく読む−その2
00/08/28 23:56 02033へのコメント

こんばんは たけ(tk) さん

古代史部屋で論議されていたときには、宝来本を所持していなかったため、議論に参加できませんでした。

2031と2033へまとめてレスします

(RE 2031)

宝来本は、宝来さんの研究の過程をたどって、記述されているので、データが集まるとともに、それまでの仮定や仮結論を、どんどん捨てていく、そういった研究のダイナミズムを体感できる本と思います。

ただし、データの解釈については、これまでの発言で触れてきたように、また、これから触れるように、疑問の点もあります。

;1 宝来さんは「アイヌ人」は「新石器時代の縄文人の現代における子孫」
; であると認識している。(p.117)
;2 琉球人集団も、少なくともその3分の1については「縄文人の直系の
; 子孫」と見て良い。(p.112)。
;3 本土人集団では弥生期以降の渡来人の割合が大きいが、「縄文系と渡
; 来系の遺伝子をほぼ1対2の割合で持っている」。(p.109)
;宝来さんの認識の理解として正しいかどうか、また、早傘さんの意見とし
;てはここら辺についてどのように考えているのか

僕の認識では、上記3点についての宝来さんの見解は、次のとおりです

1 「縄文人という日本の先住民の子孫と考えられる」のは「アイヌや琉球人」
  である。(P.116)

2a「縄文時代の最初のころから、アイヌと琉球人の祖先は別々の集団として
  存在していた」(P.111)が、
 b「アイヌ集団の約4分の1と琉球人集団の3分の1の人々は、遺伝的に共
  通項がある」(ので両者が)「縄文人の直系の祖先として、遺伝的により
  緊密な関係にあるとする見方は部分的には正しい」(P.112)

3 たけ(tk)さんの引用のとおり

これらについての僕の意見は

1 これは mtDNA のデータから得られた結論ではなく、既存の研究に基づく
  作業仮説であり、データはこの仮説に矛盾しなかったというだけ。

2a 以前述べたように、両者の分離時期の計算は困難
 b データの利用の仕方が恣意的と思われる。他の集団間の組合せについて
   2bの結論を出すのに用いた方法(わかりにくい)を適用した場合、ど
   うなるかが示されないと、判断できない。

3 図23の各クラスターに「特異性」を割り当てる基準が甘すぎるし、未証明
  の1をも、計算の根拠とするから、この数値は一見もっともらしいものの
  あまりあてになるものとは思えない。

付 アイヌのデータは、同一配列の人が多すぎる。これは比較的近い世代に共通
  の母系祖先を持つ小さい集団から試料を採集してしまった可能性が高いと懸
  念される。したがって、データの解析に移る前に、そのようなデータの歪み
  を除去する試みが必要であったと思われる。


(RE 2033)
; 次に、p.116 の「図26 塩基多様度のネット値に基づいた現代人8集団
;の系統関係」はナンセンス、有害無益だと考えています。

ええっと、P115の「東アジアのクラスター〜〜」が図26の説明で、P116の文章
; しかし、この段落の後半では「したがってこの結果は、現代日本人の起源
;についての混血説を支持するものである」とあります。
は第7章全体のまとめですから、ちょっと的がずれている気が (^^;)

クラスター図では、集団が次第に分岐を繰り返してきただけに見えるのは確かで、同じネット値を用いるにしても東アジア5集団についてはこういう風に2次元表示した方が誤解が少ないとは思います

                               ア                                        
                /                                          
              /                                             
           琉−韓日                                               
                          \                                              
                            \                                            
                              中(台)                                      
                                                                          

;「集団の系統関係」図を集団の歴史的分岐として理解するのは誤りである、
;というのが宝来さんの認識であると思うのですが、どうでしょうか?。

さほど「誤り」ではないと宝来さんは考えているように思います。クラスターの検討ではあまり明瞭な結果が出なかったのに対し、ネット値では本土日本人と韓国人の間の距離が0という数値が出た、この点に重要な意義を見出されていると思われます。
宝来さんは、日本人の起源に関する説として転換説・混血説・置換説の3つの説を挙げていますが(P93-94)、このうち置換説に近い混血説の立場をとっている、すなわち本土日本人の大多数の祖先と韓国人の祖先が、遺伝距離で計れない程度最近に分離したという見解と思います。

; また、混血説を採るのであれば、本土日本人、琉球人、アイヌ人のうちの
;縄文系遺伝子を持つ集団と渡来系遺伝子を持つ集団とを分離して分析しなけ
;れば、結論めいた図も書いてはいけないと思います。

「縄文系」や「渡来系」または、「アイヌ人」「琉球人」「韓国人」が(ニューギニア人やアメリカ先住民のように)きれいに特定のクラスターに集中していれば苦労はなかった。明瞭に分離できないために、最後は mtDNA を用いずとも計算できる集団間の遺伝距離に頼ってしまったということと思います。

なぜ、北東アジアの各集団がそろって多様な構成なのか? 各人間集団の形成史を考える上で配慮すべき事情ではあります。

                  早傘


02043/02043 HFC03726 早傘 RE:Re:宝来本を正しく読む−その2
00/08/28 23:56 02035へのコメント

大三元さん こんばんは

;折角、{縄文系の後裔と思える人々}と{渡来系の遺伝的影響を受けたと
;思える人々}の二種に大別できた、ってのがミトコンドリアDNA研究の
;大きな成果なんですからね。

大別はできなかった、というのが成果のように思いますが、いかがでしょう?

                  早傘

02047/02048 HFC03726 早傘 RE:RE^2:宝来本を正しく読む−その2
00/08/29 01:57 02044へのコメント

たけ(tk)さん こんばんは

;ちゃんと本土人の地域差の分析をしてから先に進んで欲しいと思うのは僕だけ
;だろうか?。

賛成。そう思いますよね

; また、 今問題になっているp.102の系統樹とp.15の系統樹との関係も分か
;らない。この二つは同じ資料(三島)を異なった分析方法で分析しているの
;であるから(p.96)、系統樹上の対応関係を明らかにしてくれれば、前の分
;析とも併せていろいろなことが分かるだろうと思う。なのに、やっていない。
;なんでじゃー?。

同じこと思いますよね。で、P.29の方が、P.102と同じくDループ領域の塩基配列に基づく結果だから、比較に適しています。クラスター樹形は、他のデータによって多少変るものの概ね対応するはずだと(同一配列の組の配置も手掛かりに)比較してみた結果は、こんな感じです

P.5             | グループ1|      グループ2         |   
P.29図5   C1 |  C2   | C3-C5上半 | C5下半   |   
P.102図23  − | C1-C4 |   C5-C12  | C13-C18  |   

この対応が正しければ、グループ1の比率をP103表4から計算し、P.24表2やP.44図7と比較すると、色々思うことがあります。


                        早傘


02048/02048 HFC03726 早傘 RE:宝来本を正しく読む−その3
00/08/29 01:57 02045へのコメント

たけ(tk)さん たびたびどうも

; 常識的に考えても、そのような遠距離の海を越えた女性の移動が縄文時代
;や弥生初期に(現代に痕跡を残すほど大量に)行われたとは考えにくいでし
;ょう。

この辺はシミュレーションに適した問題ですね。北海道から沖縄まで20位の地域が数珠つなぎになっているとして、隣接する地域同士は、一定期間に、一定の比率で女性が入れ替わるとする。交換率や、周期数を変数として、1万年後に北海道と沖縄がどの程度、どの地域由来の同一母系の子孫を共有するようになるかを計算してみると結構面白い。


                        早傘


02075/02076 HFC03726 早傘 RE:「縄文系/渡来系」の大別←RE^3:宝来本
00/09/04 23:56 02068へのコメント

たけ(tk)さん こんばんは

僕も、#2042あたりを書く前まで、誤解していたのですけれど、
宝来さんの「特異性」の割り当ては、それぞれのクラスターが、ある人類集団に由来するという主張ではないんです(大本をたどればある女性にたどり着けるとはいえるけれども、その女性は、東アジア5集団が分離する以前であるかもしれない)。あくまで、それぞれのクラスターが、どの集団に多く見られるかというだけの意味で、それ以上ではない。

; p.108 の大別の方法は、50人ごとのクラスター分析で、多数決によって
;「アイヌ」「琉球人」「本土人」などとクラスターを分類して、その「アイ
;ヌ」クラスター(C1、C16)と「琉球人」クラスター(C3,C13、
;C15,C17)に入っているDNA型を「縄文人の系列」としているよう
;です。

P108をていねいに読むと

“アイヌや琉球人を現在における「縄文人の系列」とし、韓国人や中国人を現在における「渡来人の系列」とする。”

ここまでの記述は、割り当てられたクラスターを差していませんね。

“これらの系列における「大陸系」の特異性の頻度が、それぞれ過去の縄文人集団における頻度、渡来人集団における頻度にほぼ対応するものとする”

つまり、「縄文人」も“大陸系の特異性の頻度は19%である”と仮定しているんです。

意味通じてますかぁ ^^;? どうも説明がしにくいな。

クラスターの割り当ての、○○人というのを無視して考えた方が分りやすい。

アイヌや琉球人に少なく、韓国人や中国人に多いクラスターがあると。三島日本人はその中間なので、両者のどちらに近くその比率はどうかを計算しただけ。

その程度のことなら、わざわざ、mtDNAを分析しなくても、血液型などから散々計算されてきたことなんですよね。しかも、血液型などの場合は、もっと多数のデータに基づいているし。mtDNAの利点は、あくまで、個人間の距離が計れることなんだから、それを活かした方法で分析しないともったいない。

; (1) C1クラスタ(宝来さんはアイヌ→縄文系としている)はオホー
; ツク文化人の系統ではないか?。

C1がそうかはともかく、アイヌが縄文人の純粋な子孫であるとは考えがたく特にオホーツク文化人をとおした影響に注意する必要がある点、同意します


                        早傘


02107/02107 HFC03726 早傘 RE:RE^5:縄文人の渡来
(14) 00/09/19 12:23 02100へのコメント

たけ(tk)さん こんばんは

;(1) 計算式はどうなっているのでしょうか?。

変異の発生頻度  7/10^8(変異/座位/年) に
500座位を掛けて 35/10^6(変異/年)
1世代28年として 35*28/10^6=0.00098(変異/世代)
端数を丸めて 0.001(変異/世代)とする

a世代の間にb回の変異が起こる確率は、

combin(a,b)*0.001^b*0.999^(a-b)
###( combin(a,b) は、a個からb個を取出す"組合せ")###

同一先祖に由来する2者のC年後の異なり字数を計算する場合

a=C*2/28=C/14 として計算することになりますが、僕の場合は、aを切りのよい数にして、C=14a として表を作成しました(だから1400年の倍数になっている)

;(2)1000年(できれば500年)単位で、2万年くらいまでを計
; 算した表を突くっていただけないでしょうか?。

以上の計算式をワークシートに設定すれば、いくらでも表が作れると思います

;(3)下の表では、横軸の合計が100%になっていますが(分岐時期
; から変異数を推定する方法)、縦軸の合計が100%になるように
; はできないでしょうか?。(変異数から分岐時期を推定する方法)。

まずは、確率が十分に小さくなるまで長い年数まで、表を縦に伸ばす。(異なり字数1の場合は7000世代程度で十分か。理想は1世代刻みだが、面倒なので、僕は確率の変化が少ないところでは200世代刻み、変化が多いところでは50世代刻みにしました)

縦の合計を出し、(刻みが一定でない場合は、重みを付けて集計する)
それで、各年代の確率を割り、範囲で集計すれば各期間の確率が計算できます。


                        早傘

02115/02115 HFC03726 早傘 RE:RE^7:縄文人の渡来
(14) 00/09/23 13:13 02112へのコメント

たけ さんどうも

; 正確には一致しないが、大体同じなので、良しとしよう。

そりゃあ、変異率0.00098で計算したら一致しないでしょう。

;* 実行に時間がかかった。縦計算ができるほどの長期間の計算をするに
;は、スクリプトの性能(実行速度)が悪すぎるみたい。

表計算ソフトは、階乗のデータをあらかじめ用意しているという話を聞いたことがあります。だからワークシートで計算した方が楽だと思うのですが。
5000年刻みでいいなら、X+5000年後の分布は、X年後の分布と5000年後の分布を組合せて計算するようにすれば、計算が早くなると思います。

                               早傘



このページへの御意見・御質問は早傘(HFC03726@nifty.com)までお寄せください。