萬維百科

ISO 639-3

ISO 639-3是個國際語種代號標準,在2007年2月5日出版。它延伸了ISO 639-2裡的Alpha-3 code(三個字母的代號),目標是涵蓋所有的語言。所以,它是ISO 639-1的超集合。ISO 639-3是ISO 639-2個別語言的超集合,但是因為ISO 639-3沒有ISO 639-2的語言集合,所以ISO 639-3不是整個ISO 639-2的超集合。

自2005年7月30日發佈的計畫草案,共有7,602個語言條目,這些語言的來源有三個:基本資料來自ISO 639-2所收錄的個別語言,和取自《民族語》裡的現代語言調查資料。而過去歷史的各類語言及古老的語言和人工語言,則是出自語言學家列表的資料。

編碼空間

因為這是採用3個字母,所以這套3字母編碼理論上最多可代表26×26×26=17,576種語言。但是,因ISO 639-2定義了4個特別代碼、520個預留區域和23個B類代碼,故此ISO 639-3可用的編碼只有17,576−547=17,030個。

其中有4個代碼用來代表特殊情況:

  • mis──「uncoded languages」(未編碼語言);
  • mul──「multiple languages」(多語種);
  • und──「undetermined language」(未確定的語種);
  • zxx──「no linguistic content」(沒有語言內容)。

標準中亦有一個供私人使用的範圍: qaa-qtz

大語言 (Macrolanguages)

在ISO 639-3代碼中,以下的語言被視為是某些其他語言的大語言(macrolanguage),即這些語言可再細分為數種以上的語言。就以漢語為例,SIL就把漢語細分為 14 種語言。

集合語言 (Collectives)

SIL在檢視過七千多種語言之後,發現以下11種被列在ISO 639-2的語言,它們之下所包含的語言,並非屬於同一語種,故在ISO 639-3代碼中被刪除。

註:比哈爾語之下有10多種語言之多,故理論上不應獲發一個ISO 639-1代碼 bh

參見

外部連結


本頁面最後修訂於2023-03-09 02:12,點擊更新本頁查看原網頁

本站的所有資料包括但不限於文字、圖片等全部轉載於維基百科(wikipedia.org),遵循 維基百科:CC BY-SA 3.0協議


頂部

如果本頁面有數學、化學、物理等公式未正確顯示,請使用Firefox瀏覽器或者Safari瀏覽器