[RFC] Multilingual names

簡介

目前多國語系的 name 標籤 (tag),社群偏好使用 alpha-2 code of ISO 639-1,因此全世界中文用戶使用 name:zh。但由於中文用戶包含簡體與繁體兩種字體編碼,以及對於國際地名翻譯不同,很容易因為共用標籤 key 產生衝突。例如 Everest 在台灣使用者偏好使用「聖母峰」、而中國使用「珠穆朗玛峰」。

為了滿足多元使用情境與需求,原有 ISO-639 標示過於簡化,建議 name 標籤使用 IETF language tag  (BCP 47) 標示多國語系,以容納各地區地名使用習慣,以及繁體、簡體、閩南、客家、廣東話、台灣原著民、拼音等語言需求。

倡議

在此倡議使用 IETF language tag  (BCP 47) 語法形式。語法形式包含了如下 subtags.

ABNF 語法如下

使用情境

依照 IETF language tag  (BCP 47) 標示,建議做出以下更動

語系後綴

OpenStreetMap 是一個使用標籤描述地理資訊的開源地圖專案,而標籤以後綴的形式支援多國語系,例如 name:en 代表英文名稱,為便於討論後綴所以整理成本表格。各語系使用如下 (好讀版本)

Mandarin 中文語系
:zh 台灣境內使用繁體中文、中国境内使用简体中文。國際地區則無共用規範產生衝突。
:zh-TW 預設是繁體中文
:zh-Hant-TW 建議使用 :zh-TW
:zh-Hans-TW 適合在台灣使用簡體字的用戶。
:zh-CN 默认是简体中文
:zh-Hans-CN 建议使用 :zh-CN
:zh-Hant-CN 适合在中国境内使用繁体字的用户。
:zh-HK 預設使用繁體中文,由於香港政權交接中國,受政治影響部份民眾改用簡體字。
:zh-Hant-HK 建議使用 :zh-HK
:zh-Hans-HK
:zh-MO 預設使用繁體中文,由於澳門政權交接中國,受政治影響部份民眾改用簡體字。
:zh-Hant-MO 建議使用 :zh-MO
:zh-Hans-MO
:zh-SG 1976 年后改用中国规范的简体字。预设使用简体。
:zh-Hans-SG 建议使用 :zh-SG
:zh-Hant-SG
Dialect 中文方言語系
:nan Minnan 閩南語, Holo-oe, Ban-lam-gu, Mǐnnán 因為閩南話次方言各地演化產生變異,漳州話、泉州話、廈門話略有不同。台灣地區建議使用 :nan-TW
:nan
:nan-TW 考慮用戶族群,建議使用台羅拼音,並以中華民國教育部出版的《臺灣閩南語常用詞辭典》選定最接近通行腔的「高雄音」做為主音讀。
:hak Hakka Chinese Kèjiā, 客家 台灣地區建議使用 :hak-TW
:hak Hakka Chinese Kèjiā, 客家
:hak-TW
:yue Yue Chinese; Cantonese
:yue-HK Yue Chinese; Cantonese 香港地區建議使用 :yue-HK
:yue-CN Yue Chinese; Cantonese 廣東等地區建議使用 :yue-CN
:cdo Min Dong Chinese 閩東話 (Min Dong Chinese), 福州話
:cjy Jinyu Chinese 晉語
:gao Gan Chinese 干彝寨方言
:hsn Xiang Chinese 湘語:吉溆
:cmn Mandarin Chinese 漢語 未用, 預設 :zh
:cpx Pu-Xian Chinese 莆仙語,興化語
:czh Huizhou Chinese 徽州話
:czo Min Zhong Chinese 閩中語
:lzh Literary Chinese 文言文
:mnp Min Bei Chinese 閩北語
:wuu Wuu Chinese 吳語
Austronesian, 南島語系, Indigenous Taiwanese
:ais Sakizaya Sāqíláiyǎ, 撒奇萊雅
:ami Amis āměi, 阿美, Pangcah
:bnn Bunun Bùnóng, 布農, Bunun
:ckn Kavalan Gámǎlán, 噶瑪蘭, Kebalan
:dru Rukai Lǔkǎi, 魯凱, Drekay
:pwn Paiwan Páiwān, 排灣, Payuan
:pyu Puyuma Bēinán, 卑南, Pinuyumayan
:pyu Shao Shào, 邵, Thao
:tao Tao Dáwù, 達悟, Yami, Tao
:tay Atayal Tàiyǎ, 泰雅
:trv Truku Taroko, 太魯閣, Tàilǔgé, 賽德克, Seediq
:trv Tsou Zōu, 鄒
:xsy Saisiat Sàixià, 賽夏, SaiSiyat
:sxr Hla'alua Hla'alua, 拉阿魯哇
:xnb Kanakanabu Kanakanavu, 卡那卡那富族
Romanization, 拼音系統
:zh-Latn 預設為漢語拼音,預設使用 name:zh-[region] or name:zh or name 之中文。
:zh-Latn-pinyin 漢語拼音,建議使用 :zh-Latn
- 通用拼音
- 台灣        國音一式
- 台灣 國音二式
- Wade-Giles 羅馬拼音
:en 由於有多種拼音系統。目前於台灣無統一拼音方式。建議遵循當地政府的慣例使用,以符合觀光客對應本地圖資的需求。
:zh-Hanb Han with Bopomofo 注音符號
:zh-Hanb-TW Han with Bopomofo 由於注音符號只有台灣地區使用,建議使用 :zh-Hanb。
CJK Han 漢字
:ja-Hani Han; Hanzi; Kanji; Hanja Japanese Kanji
:ko-Hani Han; Hanzi; Kanji; Hanja Korean Hanja

整合程序

  1. 發出 RFC 尋求意見。
  2. 提出 Proposal
  3. 「複製」台灣區域所有 name:zh -> name:zh-TW
  4. 通知 Map Render / Clieients, 依照新的命名規格,改變地名使用優先次序
    1. 依照 region 預先讀取
    2. 依照 script coding 讀取
  5. 由於 "name:zh" 將成為壅餘標籤,未來將可逐步消失。

影響 

 

 討論連結

 osm.tw 臉書社群貼文 https://www.facebook.com/groups/OpenStreetMap.TW/permalink/1020442338021235/

 osm.tw 郵件論壇討論主題 https://lists.openstreetmap.org/pipermail/talk-tw/2016-March/001277.html

 osm.cn 郵件論壇討論主題 https://lists.openstreetmap.org/pipermail/talk-cn/2016-March/000107.html

 

參考