搶救中文域名

網際網路工程組織(暫譯,英文名稱 Internet Engineering Task Force,簡稱 IETF)國際化域名工作群(Internationalized Domain Name Working Group,簡稱 IDN WG)已經在本地時間2002年元月29日凌晨發出最後通告,徵求對於該工作群預備通過的四項技術文件提供最後的修正建議。

當我們在路上收聽廣播上提到有趣的網址「http://www.prs.gov.tw」,卻老是記不住,即使想拿筆記下這個英文域名,也來不及。有了國際化域名服務之後,終於可以聽到像「警廣.台灣」這樣容易上口、好記的中文域名。這顯然是網路上的一大步,讓網站更加親切近人,商機似乎相當大。

使用拼音文字的歐洲人對於IDN技術標準的發展,表示滿意,但是,漢字域名的消費者卻將面臨重大問題。這些問題根源於此項技術規範的基礎 -- Unicode(萬國碼) -- 所帶來的副作用。這些副作用包括漢字域名的多重表示方式、以及伴隨而來的域名授權和解析等問題。以台灣大學為例,在Unicode碼表範圍之內,台、灣、學等字各有繁簡兩種字形,因此,這個名稱共有8種不同的字形組合表示法。讀者不難想像得到,一個域名當中只要有10個字有2個以上的不同字形,就1,000個不同的組合(210次方=1,024)。名稱組合的個數,隨著名稱的長度而呈指數函數成長。

在註冊域名的時候,域名的主人應當註冊幾個不同字體組合名稱才能保證自己的權益呢?如果註冊商是外國公司,當一個域名重複註冊給不同註冊者的爭議發生的時候,消費者得聘請律師越洋打官司嗎?如果域名資料庫中只儲存了某個漢字域名的不同表示法的十分之一或更少,那麼,使用者輸入的漢字網址發生比對錯誤的機率,將會非常高。政府相關部門應當如何作為以保護消費者呢?

Unicode不只繼承了各國的漢字異體字(以下簡稱異體字,指的是一組同音同義的漢字),更因為該組織當初為了統一中日韓台等各國使用的漢字,又帶進了許多字形相差不大的異體字。例如BIG-5的內 (U-5167),和日文的内 (U-5185)。由於這些異體字的存在,中文域名所對應的同音同義的Unicode字串的個數,會隨著名稱長度,而成指數成長。域名系統使用的漢字碼表容量越大,這個指數成長的特性也更明顯。當中日韓台等各國仍使用獨立的比較小的碼表,來表達各自常用的文字的時候,異體字的問題還算比較容易掌握。但是,當Unicode的版本逐步更新,Unicode碼表的容量越來越大(Unicode 2.0版21,204個漢字、3.0版有27,786個、3.1版則有70,207 個),伴隨的異體字的數量隨之大幅增加,而中文域名的混淆度也更高。

當Unicode逐步通行之後(例如,Windows 2000就有支援Unicode輸入法),異體字是我們不得不面對的問題。如果名稱只是單純地提供作為識別的用途,異體字也不構成問題。但是,在網路上,網路域名被當成了買賣交易的標的,也就和商標一樣,存在著仿冒的問題。異體字的存在導致這一套域名系統,很容易產生混淆。因此,IDN工作群的技術規範所衍生的產品有嚴重的瑕疵。如果被跨國公司拿來推動中文域名市場的話,和消費者的利益有相當大的衝突。

IDN工作群中有人認為,Unicode帶來了混雜使用不同語言文字的網域名稱的新機會。也有人認為要中日韓台等漢字使用者有了共識之後,再考慮暫時將CJK漢字排除於IDN規範架構之外。但是,這些人顯然都忽略了一個簡單的事實,如果IDN的技術規範不和Unicode掛勾的話,根本就沒有異體字的問題。IDN工作群提供了部份解決問題的方案,為漢字使用者製造了問題,卻有這般言論,令人嘆為觀止。除非異體字的問題能夠得到合理的解決,否則,就算對部份人有利,卻不利於中文域名的使用者。這樣的作為符合國際正義嗎?

換句話說,現在還不是使用Unicode來作為域名系統基礎的適當時機。而是應當先尋求國際共識,建立共同遵循的標準異體字字典。麻煩的是,使用漢字的國家對於異體字的詮釋並不一致。例如机字是中文機字的簡寫;但是,在日文中卻是茶几的意思。更複雜的是,即使在同一語言文化當中,也有部分異體字,當出現在某些語法的時候,就不再是同音同義。例如,台灣的「午後」和中國簡體的「午后」是同音同義;但是,「皇后」就不等於「皇後」了。因此,IETF或其他組織有必要集合各國的文字專家來辨識清楚到底哪些文字之間存在著異體字的關係。哪一些是國際共通的異體字?又有哪一些是和語法無關(context free)的?另外,若能鎖定在較早的Unicode版本,以制定出對應的異體字字典的話,將有助於控制中文域名的複雜度。這套字典將有助於衍生出較為合理的中文域名產品。

根據報載,販售國際域名的跨國企業早就已完成佈局,只等IETF的相關標準規範一通過,馬上就要趁機大展鴻圖。IDN工作群不擬等待這些問題得到合理的解決,就逕自發出最後通告,罔顧這些問題的存在,此舉無異於為這些外商護航,也將損害國人使用中文域名的權利。

我們呼籲政府相關單位,例如消費者保護委員會與公平交易委員會等,儘速採取保護消費者的行動,以阻止外國公司挾其品牌優勢,來台販售有瑕疵的中文域名商品。

在IETF IDN工作群最後公告的一週期限之內,我們呼籲廣大的消費群眾,採取一人一信的行動,直接寄信給IETF IDN 工作群,對於漢字使用者權益受到漠視的現況,表達我們的強烈不滿。IDN採用Unicode作為技術基礎的做法,既然為中文域名使用者帶來難題,就不該誇稱他們已經找到完整的國際化域名解決方案。如果拼音文字使用者急著要擴充他們的域名範圍,那IETF就應當將CJK漢字暫時排除在他們的標準之外。並且我們也不放棄透過IETF等適當的國際組織進行國際合作,以盡快為異體字和中文域名系統等問題尋求具體可行的解決方案。