(溫馨提示:簡化字版本見後。此外文章裏面有一些偏技術性的內容,暫時看不懂的話先忽略就好,以後接觸到了再去理解不遲。)
目前,中國歷代皇族裏,愛新覺羅家族的Y染色體已經確定,是C2b1b2a-F下面的,屬原先的C3北支即現在的C2b-F,和成吉思汗以前的黃金家族C2b1b1-F較近(見《人類學雜記39》)。除此以外,朱明皇族和耶律家族目前已知有一些證據,但仍然沒有定論。
我接下來希望能確定的是趙宋皇族的Y染色體。趙宋皇族指太祖趙匡胤和太宗趙光義之父趙弘殷的後代。北宋自太宗之後,直到徽宗、欽宗的歷代皇帝,以及南宋的開國皇帝高宗,都是太宗的後代。但太宗支在靖康之難後所剩無幾。高宗無嗣,南宋從孝宗開始,皇位分屬於太祖趙匡胤的兩個兒子德芳、德昭兩人的後代。宋朝皇室普遍人丁不很興旺,皇位父子相傳最多三代,之後就需要由旁支入繼。此外太祖和太宗的弟弟,魏王趙廷美也有較多的後代傳承到現在。也即,現有的宋朝皇室後代根據家譜,主要屬於太祖後代的德昭、德芳,及魏王廷美這三派,另外也有一些家族自稱是太宗的後代。
我幾年前就開始與德昭派(譜上接近宋理宗)的趙誼夫先生(分子人類學論壇和新浪微博的
Greenbrothers)合作,探尋趙宋皇族的Y染色體。因爲至今仍沒有合適的古DNA樣本,我們仍然是試圖通過活人的樣本來解謎的。年趙宋宗親在浙江諸曁農村一所祠堂舉行了一次祭祖大會,趙誼夫先生帶着我去對多位宗親採了血樣。除了這次採到了諸曁的多個家族以外,我還採到過譜記爲趙宋皇族的福建泉州(原南外宗正司所在地);浙江紹興越城,杭州富陽、蕭山,寧波餘姚;安徽太湖;山東棗莊等地的趙宋皇族(依自述,不都有完整家譜)。以上自稱爲趙宋皇族的,去除最近的重複樣本(同村或者不同村但譜記清代或以後共祖,且STR相差2步以內),共有27支,測下來是這樣的情況:
O1a1a-P:16支
Cα-F:3支
N-M:2支
O2a1a1a1a1-M、Oγ-F11、O2a2a1a1-M、Oβ-F46、Oα1a1a-F、R1a1a-M17各1支
從以上數據來看,似乎結果是明確的,O1a1a-P單倍羣是絕對的候選。但問題在於,以上27支中有16支的籍貫是浙江紹興,其中包括了12支O1a1a-P。而且其中也發現了一些DNA不符合晚近家譜及族內過繼的情況。這樣,除掉紹興以外的樣本,就是11支樣本,其中只有4支是O1a1a-P了。因爲趙家唐代時源於河北涿郡,而我手裏的數據O1a1a-P在河北只有2%左右。而且O1a1a-P又是在浙江比例最高的單倍羣(超過20%),推測可能主要來源於古代百越土著,北方分佈較少,不能排除是多支紹興當地的土著分別進入了趙宋的族譜。
除此之外,我們把所有自稱趙宋後裔的O1a1a-P的樣本的15Y-STR(傳統17STR去掉DYSa/b)拿出來,做了一下网絡圖:
圖裏面的一個圓圈代表一個15Y-STR的單倍型,圓圈的直徑和該單倍型的樣本數量成正比,連接圓圈的線段的長度正比於單倍型之閒15Y-STR相差的突變步數。圓圈的顏色,黃色爲浙江紹興(主要爲諸曁),綠色爲福建泉州,其它顏色各是不同地方的。
現在問題來了:趙宋的擴張時閒應該在年之內(太祖生於公元年),以上所有O1a1a-P樣本從Y-STR來看,應該遠遠超出了這個年代(同樣是15Y-STR,對比愛新覺羅,多年,兩兩之閒最多差3步;嚴嵩家族,多年,兩兩之閒最多差4步),上圖的兩個大黃圈之閒相差都已經有6步了,而且並不是一個晚近擴張的星簇的形狀(因爲年代較新的支系,通常還會有較多的現代後代維持始祖的Y-STR單倍型,保留在原處形成一個較大的圓圈,和其它有所突變的單倍型共同構成一個星狀結構)。如果只看左邊的那部分,倒確實滿足一個年左右的擴張,但問題是都是紹興的樣本,盡管依族譜也分作德昭、德芳、太宗派下,但因太平天國時人丁銳減,之後出現了較多的族內過繼,以我的角度來說,仍是孤例不能作證,就算他們確實構成一個單系羣,也不足以說明宋初的情況。
另外,上圖中每一個單倍型在我數據庫裏面搜,17STR差2步之內都能有大量其它姓氏的樣本匹配,因爲O1a1a-P下游F78+支系本身就在近年內在中國南方有急劇擴張。也就是說,我認爲以現有的證據,還無法確認趙宋皇族的Y染色體屬於O1a1a-P這支。
因爲用Y-STR估算時閒是非常不準的,我後面準備用自己的科硏經費測一些上面圖裏的樣本的Y染色體高通量測序,通過Y-SNP數量計算相對準確一些的分離年代(10Mbp以上區域能到年左右一個突變)。同時,把整個O1a-M這一大支的Y高通量樹整個算一下,看看其中各層級的相對準確的分化年代,以及拓撲結構和族羣分佈的特點。
爲了以上的目的,我們現在向大家重點徵求兩樣東西:一個是譜記趙宋皇族後代的樣本,一個是在復旦和源基因以外的其它機構檢測得到的屬於O1a-M這個支系的Y染色體高通量測序的bam文件。
因爲我目前在實驗室沒有學生能夠穩定做實驗(學生做這種簡單實驗太浪費,也太耽誤時閒,還是處理數據、寫文章能人盡其用),現在我這裏的樣本都是送到源基因(