首頁>社情·民意>你言我語 你言我語
總在證明“我是我” 生僻字統一字庫到底有多難?
統一字庫到底有多難
一個不小的群體,經歷著為“名”所累的難題。另一位名字里含有“韋華”字的受訪人對中國青年報·中青在線記者說:“現在技術這么發達,收錄整本《新華字典》的漢字占不了多大空間,到底難在哪兒?”
據報道,今年兩會,全國政協委員、中國科學院大連化學物理研究所潔凈能源國家實驗室主任李燦提交了《關于解決姓名中含有生僻字人員辦證難問題的提案》,建議國家相關部門統一升級字庫。
李燦在他的提案中稱,據不完全統計,在全國13億人口中,名字中有生僻字的超過6000萬人次,這類問題涉及的并非極少數人,這還不包括少數民族名字中的分隔符問題。
這位政協委員建議指定機構、指定網站更新漢字總字庫,在身份信息核定的初始機關使用統一漢字庫,并保證該字庫內的字都是通過常用輸入法輸入,避免需要身份識別的機構無法識別戶籍系統錄入的信息,實現信息共享。需要核實身份信息的機構,要同步更新字庫、升級系統,使各級職能部門電腦字庫在規定時間升級并保持一致。
某種程度上,鐘韋華是不同部門之間“信息孤島”的一位難民。國務院總理李克強表示,過去較長時期一些地方和部門的信息化建設各自為政,形成“信息孤島”和“數據煙囪”,嚴重制約政府效能提升,給企業群眾辦事創業造成很大不便。去年12月,李克強簽批了《“十三五”國家信息化規劃》并明確表示,“信息孤島要堅決打通,起碼政府系統不應再有”。
關于生僻字帶來的困擾,搜狗輸入法高級總監楊磊表示:“隨著數字時代和效率優先的步伐越走越快,各種輸入工具只重視多數人利于交流的便利,確實忽略掉了少數生僻字的錄入。”
他介紹,漢字中的生僻字有4萬多個,且大部分很少使用。在字符編碼上,這些漢字需要4字節編碼,而微軟WINDOWS系統默認僅支持2字節編碼的漢字。雖然可以采用自造字的技術支持,但受限于系統自造字的碼位限制,僅能加入幾千個字,“所以我們會在收集到用戶缺字反饋時酌情加入。”
楊磊表示,搜狗輸入法收錄生僻字的工作一直都在進行,3年前啟動“一字千金”活動,向全民征集生僻字、缺字,征集了大概4萬多個;兩年前的生僻字版本上線,先期上線了6000多個。“未來,我們還會通過各種手段,一方面盡量解決用戶在輸入上的困難;另一方面也會通過多種活動在社會層面引發大家對生僻字、對漢字文化的關注。”
鐘韋華關心的問題在于,明明在公安部門能顯示出的名字,為什么換一個部門就顯示不出來?
公安部在官方網站回復網民“關于咨詢有關身份證等證件上的生僻字問題”時解釋,為解決少數公民姓名中使用了生僻漢字、計算機系統無法識別錄入的問題,公安機關從2002年開始研究、開發統一的人口信息專用字庫和冷僻字解決方案。截至目前,包含3.2萬個漢字的人口信息專用漢字字庫已在公安人口信息管理系統中使用。新發現的冷僻字,凡符合國家語言文字規范和標準的,統一增補到專用字庫中,盡可能滿足公民辦理戶籍和居民身份證的需要。
公安部還提醒說,由于冷僻字不屬于國家通用規范漢字,即使公安機關通過專門手段實現了戶籍信息的錄入等問題,并不表示在其他部門和行業領域能夠通行,建議公民在取名時盡量使用通用規范漢字,“避免給自己的經濟社會生活帶來不必要的麻煩”。
為了幫生僻字統一“通行證”,2016年5月,公安部會同國家民委、教育部、工信部等14個部委聯合發布了《關于在政府管理部門和社會公共服務信息中統一姓名采集應用規范的通知》,要求實現對國家標準編碼漢字全覆蓋的要求,加快信息系統升級改造。
2016年7月,公安部聯合工信部、人社部、住建部、衛計委、人民銀行、中國民用航空局、中國鐵路總公司等部門,推動姓名中含有冷僻字的身份證在各用證部門特別是基層窗口單位全面正常使用。
就在這一系列文件下發的幾個月之后,鐘韋華還是把名字改了,“我實在是等不起了。”
現在,他叫鐘瑋。少了那份長輩所希冀的“光明和美好”,他戀戀不舍,家人也不太開心。
對新的“鐘瑋”來說,麻煩還沒有結束。他此前20多年的人生,已經與那個生僻字綁定在一起,留下了無數的記錄和證件,不知何時就會冒出來,等著他逐一修改。他只是用新的麻煩替換了舊的麻煩。(記者 胡春艷)
編輯:梁霄
關鍵詞:生僻字 統一 字庫