版權歸原作者所有,如有侵權,請聯係我們(men)
泛亞(ya) 歐語係的起源和擴散
導 讀
在漫長的歲月裏,人類與(yu) 人類相遇、交流、分離,他們(men) 的語言也碰撞、融合、分化。最近,由語言學家、考古學家和遺傳(chuan) 學家合作的一項研究,發現說日語、韓語、突厥語、蒙古語和通古斯語的人們(men) 有著共同的基因學和語言學上的祖先——他們(men) 曾於(yu) 9000年前生活在今天中國東(dong) 北部的西遼河流域。
撰文 | 王一葦
責編 | 陳曉雪
語言學家將世界上的語言按演化關(guan) 係分為(wei) 不同的語係。其中一種分類叫 “泛歐亞(ya) 語係”,包括通古斯語族、蒙古語族、突厥語族、日本-琉球語(族)和朝韓語(族)。使用這些語言的居民分布在整個(ge) 歐亞(ya) 大陸,人口上億(yi) 。
近日,一項曆時六年、集結11個(ge) 國家學者的三學科交叉研究發現,泛歐亞(ya) 語係的人群有一個(ge) 共同的祖先:他們(men) 曾經居住在距今約9000年前——也就是新石器時代的中國東(dong) 北部。
2021年11月11日,《自然》雜誌發表了這項研究 [1]。該研究認為(wei) ,青銅時代之後東(dong) 北亞(ya) 各地區間頻繁的語言交流,掩蓋了這些語言在本質上同源的事實。而實際上,新石器時代早期,就有中國東(dong) 北的農(nong) 民穿越東(dong) 北亞(ya) 大陸,進入日本、韓國所在的地域。他們(men) 帶去了自身的基因和文化,也帶去了原始的語言。
“我們(men) 的研究顯示,說日語、韓語、突厥語、蒙古語和通古斯語的人們(men) 有共同的基因和語言學上的祖先,他們(men) 生活在中國東(dong) 北部的西遼河流域。” 論文的通訊作者、德國馬普人類曆史科學研究所教授 Martine Robbeets 說。她和研究團隊還通過語言學和考古學研究指出,農(nong) 業(ye) 在語言的擴散中發揮了重要作用。
圖1 東(dong) 北亞(ya) 語言、農(nong) 業(ye) 和遺傳(chuan) 擴張的融合。紅色為(wei) 阿穆爾血統,綠色為(wei) 黃河血統,藍色為(wei) 繩文血統。紅色箭頭表示新石器時代種植粟的農(nong) 民向東(dong) 遷移,將朝鮮語和通古斯語帶到指定地區。綠色箭頭標誌著新石器時代晚期和青銅時代稻作農(nong) 業(ye) 的融合,將日本語從(cong) 韓國帶到了日本 | 圖源[1]
北京大學考古文博學院副教授張海認為(wei) ,這是一項真正意義(yi) 上的文理交叉的研究。“尤其是把語言學和考古學用量化的方法表述,采用跟古DNA一樣的分析方法,貝葉斯係統發生學方法,將語言學、考古學與(yu) 古DNA鏈接起來,討論一個(ge) 關(guan) 鍵性的科學問題。”
“(這項研究)為(wei) 統一的泛歐亞(ya) 語係的存在提供了計算語言學的證據支持,”澳大利亞(ya) 國立大學考古和人類學學院榮譽退休教授 Peter Bellwood 在隨刊發布的論文述評中寫(xie) 道 [2]。長期以來,關(guan) 於(yu) 泛歐亞(ya) 語係的源頭爭(zheng) 議頗多,他認為(wei) 這項研究對厘清爭(zheng) 議作出了 “可喜的貢獻”。
古DNA研究者們(men) 則對文章中提供的新基因證據感到興(xing) 奮。
“這篇研究新產(chan) 生了來自韓國日本琉球群島新石器時代及以後的古基因組,這些基因組的發表填補了目前朝鮮半島琉球群島等地古DNA數據庫的空白。” 德國馬普人類曆史科學研究所博士後王軻通過郵件告訴《星空体育官网入口网站分子》。
“韓國很有意思,” 中國科學院古脊椎動物與(yu) 古人類研究所研究員付巧妹說,“相比日本,它很早的(基因組成)就已經不一樣了,說明(東(dong) 亞(ya) 北部的)影響更早是在韓國,較晚的時候才到日本。”
1
“泛歐亞(ya) 語係” 的起源之謎
Martine Robbeets 是 “泛歐亞(ya) 語係” 概念的提出者之一,這一概念指的是指東(dong) 起太平洋,西至波羅的海、黑海和地中海的地理上相鄰的一批語言 [3]。但並非所有語言學家都認同這一概念。
泛歐亞(ya) 語係的概念衍生於(yu) 早在18世紀就出現的 “阿爾泰語係”(altaic languages)。阿爾泰語係將歐亞(ya) 大陸的蒙古、突厥和通古斯等幾個(ge) 語族依照相近地理位置歸類,認為(wei) 它們(men) 來自同一個(ge) 源頭。後來的 “泛歐亞(ya) 語係” 則在此基礎上加入了日本-琉球語族和朝韓語族,認為(wei) 這些語言的人群都有共同的祖先。Robbeets說,這是因為(wei) 語言學研究結果證實,這五個(ge) 語族的語言存在共同的基本詞匯。
圖2 泛亞(ya) 歐語係的起源和擴散 | 圖源[2]
無論是 “阿爾泰語係” 的概念,還是 “泛歐亞(ya) 語係” 的內(nei) 涵,在語言學界均有反對聲音。一些學者認為(wei) ,這些語言(泛歐亞(ya) 語係涉及的五個(ge) 語族)並非同源,隻是存在大量交流產(chan) 生的相似詞匯;另一些則認為(wei) ,日韓語同源,而兩(liang) 者與(yu) 其他幾個(ge) 語族並不同源。
“他們(men) 說的都很對,隻是是在不同層麵上看問題,” Robbeets說。“我們(men) 之所以在這一問題上有這麽(me) 大的爭(zheng) 議,很大的原因是借用(borrowing)的現象非常普遍……但它們(men) 一定程度上掩蓋了極少量的由繼承(inherited)得到的詞匯。” 她也認同日韓同源的說法,但認為(wei) 應該將比較的視野擴大到泛歐亞(ya) 語係。
Robbeets認為(wei) ,起源問題之所以難有定論,真正的問題是很難確定語言學者們(men) 提出的證據是否確鑿。“問題並不是沒有足夠的證據,而是人們(men) 的設想,甚至是幻想太多,虛構多於(yu) 事實。”
2
尋找語言的原型
圖3 語言學者Robbeets教授在比利時的家中與(yu) 《星空体育官网入口网站分子》視頻連線。她笑稱自己是埋案工作“扶手椅學者”。歐洲正午耀眼的陽光下,她背後是滿滿一架子色彩斑斕的書(shu) 。隨便抽出一本,可能就記載著世界某個(ge) 角落不為(wei) 人知的當地語言。
Martine Robbeets 日常的工作就是伏在案頭,從(cong) 這些書(shu) 籍記載的不同語言中抽取各種元素,分析、比對。
她自己精通或掌握近10種語言,包括比利時當地的三種方言、英語、日語、韓語,一些簡單的俄語、突厥語和蒙古語。這些語言大多是在她赴日、韓、俄等地學習(xi) 和研究過程中習(xi) 得的。
Robbeets說,語言中有一類詞相對來說不具有文化含義(yi) ,它們(men) 代表一些最簡單的概念,比如house和food。她將之稱為(wei) “基本詞匯”。由於(yu) 借用詞匯很多時候與(yu) 文化相關(guan) ,研究基本詞匯在不同語言中的分布能夠很好地避開借用詞匯的影響。語言學家們(men) 在長時間的摸索中已經列出了一張由100個(ge) 詞組成的 “基本詞匯” 清單,方便在比較不同語言時使用。
即便如此,比較不同語言的基本詞匯並不簡單。2003年寫(xie) 博士論文時,Robbeets收集了語言學家們(men) 提出的10,000個(ge) 認為(wei) 是泛歐亞(ya) 語係的詞源,這些詞源對應2000個(ge) 詞,也就是說,每個(ge) 詞都有5個(ge) 左右可能的詞源,究竟哪個(ge) 才是真正的詞源呢?
“當我收集了那麽(me) 多證據,反而覺得這一切都很虛,所以我當時真正的目標是去證明泛歐亞(ya) 語係的語族之間沒有關(guan) 聯。” 她一個(ge) 一個(ge) 地檢查詞匯,用語言學的邏輯判斷這個(ge) 詞是否能通用到真正算作詞源,如果有一絲(si) 值得懷疑的地方就刪掉。最終,她將10,000個(ge) 詞縮小到300個(ge) ,“我嚐試了所有方法,但沒有辦法再拒絕這些詞了。”為(wei) 了確認這一點,她又比對了這些詞的發音,發現它們(men) 在發音上也遵循相應規律。
除了使用詞源,她同時也通過詞態和詞綴等詞語形態學的方法確認,發現這些詞在形態上也互相關(guan) 聯。因此她確信,這些詞是泛歐亞(ya) 語係的同源詞匯。
在此次發表的論文中,Robbeets和同事們(men) 選取了泛歐亞(ya) 語係的五個(ge) 分支裏的98種語言,在每種語言裏尋找254個(ge) 詞源詞,“有時候能在三個(ge) 分支裏找到,有時候四個(ge) ,” 她說,“我們(men) 的數據庫非常龐大。”
圖4 Robbeets舉(ju) 例說明了一個(ge) 詞源詞“wood”(木)的比較過程。在2018年的論文中,她選取的詞義(yi) 更為(wei) 寬泛,因而得出的語族間的正相關(guan) 關(guan) 係更強,而2021年的此次研究中,她對詞語的選擇更精細了,盡管正相關(guan) 關(guan) 係減弱,但她獲得了更豐(feng) 富的數據點。
然後,他們(men) 用統計學方法(貝葉斯係統發生學方法,Bayesian Phylogenetic Analysis)來分析這些詞的發展過程。分析結果指出,泛歐亞(ya) 語係的 “原型語”(Proto-Transeurasian language)大約在距今9181年前開始分化,6811年前阿爾泰語係從(cong) 中分出,5458年前日本語族和朝韓語族分出,4491年前蒙古語族和通古斯語族分出。
3
在語言學的邊界之外
“人類的語言有10萬(wan) 年曆史,而語言學能夠研究的也隻有1萬(wan) 年而已,” Robbeets說。
在從(cong) 新石器時代到現在的這一萬(wan) 年的時間裏,不同語言的演化有快有慢,變化有大有小。傳(chuan) 統語言學在假設變化勻速的基礎上推算語言的分化,必然有種種不準確處。
“這就是為(wei) 什麽(me) 遺傳(chuan) 學方法非常有用,” Robbeets說。大約15年前,語言學家們(men) 開始將基因檢測方法結合到語言學進化樹的建立中,改進了預測。
在過去20年的研究經曆中,Robbeets逐漸意識到,語言學分析雖然告訴了她泛歐亞(ya) 人群的起源,但無法提供更多信息:他們(men) 曾經居住在何處?什麽(me) 時候開始遷移?如何遷移?為(wei) 什麽(me) 分散到東(dong) 北亞(ya) 各地?引入考古學和遺傳(chuan) 學能幫助解決(jue) 這些問題。
“語言學本身並不能最終解決(jue) 人類曆史科學中的重大問題,但結合遺傳(chuan) 學和考古學,它可以增加某些情景的可信度和有效性。” 她說。
同時使用語言學、考古學和遺傳(chuan) 學方法做研究並非這篇論文首創,但如此大規模的並行研究確實少見。Robbeets表示,這次研究提出的跨學科合作模式仍然在探索階段,她希望能延續這一模式,以考古學和遺傳(chuan) 學方法擴展語言學研究的邊界。
六年前,Robbeets向歐盟申請了一項200萬(wan) 歐元的跨學科研究基金,並用自己曾經在日本、韓國求學建立的人脈關(guan) 係組建了一個(ge) 龐大的團隊。2019年,她還到訪中國,拜訪了吉林大學生命科學學院的崔銀秋教授。“非常有才華的學者”,她說,崔銀秋建議合作,並讓自己的學生寧超加入Robbeets的團隊,赴德國開展研究。
寧超目前已在北京大學考古文博學院任職。在德國馬普人類曆史科學研究所的日子裏,他負責這項研究中大部分的古DNA數據收集工作。他收集了東(dong) 北亞(ya) 所有已經發表的古代基因組數據。
“跨國多學科的團隊組建是非常不容易的,首先我們(men) 要了解不同學科,包括考古、語言和DNA,國際上都有哪些科學家在做與(yu) 本課題相關(guan) 的研究,其次是要確保哪些科學家對交叉學科研究話題感興(xing) 趣,而且還要尊重其它不同學科的研究成果。” 在給《星空体育官网入口网站分子》的郵件回複中,寧超說。
在六年時間裏,研究團隊多次舉(ju) 辦線上以及線下的交叉學科會(hui) 議,分別呈現不同學科的最新進展和發現,然後再進行綜合性探討。他們(men) 將這種研究方法稱為(wei) “triangulation”(三角測量法)。
Robbeets強調,雖然團隊從(cong) 三個(ge) 學科方向開展研究,但研究過程相對獨立,數據的收集、分析和結果都單獨進行,因此避免了 “內(nei) 循環”,即互為(wei) 邏輯結果的可能性。隻有在研究的最後階段,三個(ge) 學科的推論才會(hui) 通過不同變量相互映射,比較評估證據的融合程度,包括相關(guan) 度、不一致性、不確定性和可能的偏見。
在比較三個(ge) 學科結果後,文章得出結論,跨歐亞(ya) 語言的起源可以追溯到新石器時代東(dong) 北亞(ya) 最早開始種植粟的人群。新石器時代早期到中期,種植粟的農(nong) 民從(cong) 西遼河擴散到鄰近地區。而新石器時代晚期、青銅器和鐵器時代,種植粟的農(nong) 民逐漸與(yu) 黃河、歐亞(ya) 西部和繩紋人口混合,並在耕種中加入了水稻、歐亞(ya) 西部農(nong) 作物和畜牧業(ye) 。
4
跨學科合作,語言學研究的未來?
張海認為(wei) ,研究中泛歐亞(ya) 語係人群起源於(yu) 中國東(dong) 北西遼河流域的早期旱作農(nong) 業(ye) 人群,泛歐亞(ya) 草原的遊牧為(wei) 特征的人群起源於(yu) 定居農(nong) 業(ye) 的擴散的結論,“顛覆了過去的認識。” Peter Bellwood 也在述評中表達了類似觀點。
研究古DNA的付巧妹認為(wei) ,雖然從(cong) 基因證據上得出了起源結論,但具體(ti) 的遷移是如何發生的,農(nong) 業(ye) 可能隻是其中一個(ge) 因素,實際上的原因很可能更為(wei) 複雜,尤其是越為(wei) 晚近的年代,文化對遷移和語言的影響會(hui) 越強。
Robbeets對此回應稱,她認為(wei) 農(nong) 業(ye) 是一個(ge) 重要因素,但並未排除其他因素。例如,其中一個(ge) 她認為(wei) 需要更多研究的因素是氣候變化。在過往研究中,氣候變化的時間似乎和語言分化的時間有不錯的相關(guan) 性。
而對於(yu) 泛歐亞(ya) 語係人群和其他語係,如同樣活動在亞(ya) 洲大地上的漢藏語係人群,是什麽(me) 樣的關(guan) 係,仍然是個(ge) 未解之謎。
“該文章提出的問題更重要,” 張海說,“第一,仍然有一處關(guan) 鍵時段古DNA樣品的缺失,即距今8000年的西遼河流域的旱作農(nong) 業(ye) 人群。第二,泛歐亞(ya) 語係與(yu) 漢藏語係應該是兩(liang) 個(ge) 不同的來源,如果泛歐亞(ya) 語係與(yu) 漢藏語係都是旱作農(nong) 業(ye) 基礎,那麽(me) 這兩(liang) 個(ge) 語係有不同的起源嗎?”
在問到有關(guan) 泛歐亞(ya) 語係和漢藏語係關(guan) 係的問題時,Robbeets說,她認為(wei) ,兩(liang) 個(ge) 語係有不同的起源,一個(ge) 發源於(yu) 西遼河流域,一個(ge) 發源於(yu) 黃河流域,但在史前時期有語言借用的現象,而研究這種借用是她下一步要做的事之一。“我認為(wei) 了解這兩(liang) 個(ge) 農(nong) 民社群如何互相影響,以及這在遠古時期傳(chuan) 遞的信號是什麽(me) ,是非常必要的,” 她說。
她在一個(ge) 月前剛剛招募了一位來自中國的博士生,在未來3-4年內(nei) 將專(zhuan) 門研究兩(liang) 個(ge) 語係間語言借用的問題。
她希望在後續研究中繼續交叉學科合作。在此次論文研究中,她說難度最大的就是將各種不同的證據整合到一起。
“ ‘三角測量法’ 這種方式仍然不夠完備,還在發展中,” 她說,除了需要更多資金支持,她也計劃舉(ju) 辦更多的學術會(hui) 議來探討這一合作應該如何開展。
“目前我們(men) 還隻揭開了一點點麵紗,未來仍然有許多要做的,” 她說,“我也希望未來這個(ge) 領域能擴展得很好。”
致 謝
感謝莫斯科大學生物係在讀博士生郭林、複旦大學現代語言學研究院研究員張夢翰對本文的幫助。
參考文獻:
[1]https://www.nature.com/articles/s41586-021-04108-8
[2]https://www.nature.com/articles/d41586-021-03037-w
[3]
歡迎掃碼聯係科普老師!
深圳科普將定期推出
公益、免費、優(you) 惠的科普活動和科普好物!


