往期阅读
当前版: 21版 上一版  下一版
上一篇    下一篇
放大 缩小 默认   
相关新闻
推进汉字数字化

国标字库新增1.7万个生僻字

  生活中,我们一般把使用频率较低、不太常用的汉字称为生僻字。由国家标准委联合有关部门发布的新版《信息技术 中文编码字符集》将于8月1日正式实施,将增加录入万余生僻字。

  新版标准共收录汉字88115个,比上一版增加录入了1.7万余个生僻字。其中包括近年来群众反映较多的典型人名、地名生僻字等。

  新版标准不仅收录《通用规范汉字表》全部汉字,还可覆盖我国绝大部分人名、地名用生僻字以及文献、科技等专业领域的用字,以满足各类使用需求。

  其实,生僻字的搜集和整理已开展几十年。新版标准出台后,未来相关工作还在继续开展,标准中的字库也会不断扩充。经专业审核后通过的生僻字都将被赋码并录入国标字库,最终实现在电脑、手机等设备及信息系统中无障碍地输入与显示。

  安阳师范学院甲骨文信息处理教育部重点实验室主任刘永革介绍:“生僻字就像甲骨文一样,通过甲骨文我们可以了解商代的社会现象。研究透生僻字或者把它保护下来,也是对当时文化的一种保护。”

  据了解,全国有大量人名、地名、古籍、方言中都包含生僻字,其中很多还尚未完全实现数字化。

  汉字是一种表意文字。每个汉字有独特的含义和字形,生僻字其实就是表意字所特有的信息处理问题。

  工信部电子工业标准化研究院工作人员介绍,信息系统要识别和输出汉字需要一字一形一码,一个字要对应一个编码,然后再有对应的字形,才能够正确处理一个汉字。

  生僻字编码的标准化工作包括汉字的使用范围、形音义正确性、字形区别与认同等工作,涉及语言文字、文化、信息技术和标准化等领域,较为复杂。

  从做筛查整理、提交国际提案、在国际标准化组织进行审查,再反馈到国家标准同步更新,一个字从提交到进标准需要3到5年。

  四十多年来,相关部门已研制、发布汉字信息处理相关的国家标准、行业标准数十项,编码标准中已收录汉字近9万个。但由于多重原因,大多数汉字信息处理系统支持的汉字数量在二三万左右,大量已纳入信息技术标准,本应在信息世界畅行无阻的汉字被迫成为生僻字。

  据央视新闻

上一篇    下一篇
 
     标题导航
电脑无法录入 读音被人念错 担心被人嘲笑~~~
相关新闻
推进汉字数字化~~~
   第01版:要闻导读
   第02版:今日观点
   第03版:要闻快报
   第04版:要闻快报
   第05版:都市新闻
   第06版:热线新闻
   第07版:社会新闻
   第08版:经济新闻
   第09版:为民创城不停步
   第10版:中国新闻
   第11版:中国广角
   第12版:中国关注
   第13版:中国视点
   第14版:中国广角
   第15版:中国健康
   第16版:中国纪录
   第17版:国际新闻
   第18版:国际广角
   第19版:文娱新闻
   第20版:文娱新闻
   第21版:文娱新闻
   第22版:体育新闻
   第23版:体育新闻
   第24版:天龙文苑
尴尬的生僻字姓名群体
国标字库新增1.7万个生僻字