第十期 : 2005年8月

政府撥款6,000萬元資助公共政策研究

問與答:有關首席研究員放假超過183天的規定
視察嶺南大學
海洋缺氧威脅魚類生存
珊瑚及海綿類動 物研究發現自然防污損化合物
以介殼類海產動 物為海魚養殖區生物過濾器
兒童雙語資料庫有助語言學研究
語素意識為中文能力發展提供線索
與漢語有共同來源的語言


亞洲具有重要歷史價值的語言,大多都與中文有過接觸,這些語言的詞彙現在已收錄進一個大型語言資料庫(語料庫)中。這個在東亞首創的語料庫包括99種漢藏語系的語言和方言,每種都保存了超過1,000個詞語。
孫教授正在研究中國四川的爾蘇語,一種約有2萬人使用的語言
語料庫內的語言
(1) 藏緬語系:包括很多語言,如彝語(中國雲貴川)、藏語、塔芒語(尼泊爾)、緬語和克倫語(緬甸)。
(2) 苗瑤語系:中國苗族和瑤族所用語言。
(3) 侗傣語系:包括泰語、老撾語及一些中國語言,如黎語(海南)、侗語(貴州)及壯語(廣西)。
(4) 漢語
(5) 南亞語系:包括佤語(中國及緬甸)和莽語(中國及越南)。
(6) 南島語系:包括泰雅語及排灣語(台灣),及他加祿語(即菲律賓語)。
(7) 學者構擬的古代讀音
這些語言大部份使用於東亞及東南亞地區,有些已瀕臨失傳。
比如中國四川的卻域語,目前只有7,000人在使用。語料庫也包括學者構擬出來的原始漢藏語的讀音,就是這種史前的語言後來演變為各種漢藏語言。
首席研究員香港科技大學人文社會科學學院前院長丁邦新教授說,語料庫對語言學家有很大的用處,而且保存了未經挖掘的語言歷史。
研究項目的一個主要目標,是找出各種語言間的親屬淵源關係。丁教授指出,研究的重要結論之一,是證實包括泰語、老撾語及中國廣西的壯語在內的台語,極可能屬於漢藏語系。
他說:「在此之前,漢語與台語的相關詞彙是出於同源還是語言接觸的結果,還沒有定論。現在我們相信,兩個語族是來源於同一種遠古語言,也就是說有親屬關係。」
另一個論點是苗瑤語族很可能屬於漢藏語系,但丁教授表示這仍有待更多的研究和證據,才能下定論。語料庫的詞彙,來自超過一百 個地點的語言,主要是由北京中國社會科學院的人員在過去四十年調查、搜集得來,其中包括項目的合作研究員孫宏開教授。
語料庫是用FoxPro軟件的中文版編寫而成,現在也可以將查尋的結果輸出為MS Word及Excel檔。未來的計劃包括在今年內製成網絡版本,讓用戶從互聯網查詢。
目前,語料庫已安裝於北京 和台北的學術機構和香港科大,使用者可在七大類語言和方言(見附表)中搜尋詞語,也可以通過中、英文意義或國際音標進行搜尋。
丁教授補充說,學者是通過比較現代語言推測遠古最可能的讀音形式,從而構擬出6,000年前的先祖語言(語言學家稱為「原始母語」)。

首席研究員
丁邦新教授:shphting@ust.hk