由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Zhejiang版 - (ZT) 也谈生僻字的信息处理
相关主题
曦曦这两天忙啥去了。分享:自编学汉字系统--汉字卡片,字帖打印,趣味汉语等 (转
(ZT) 常用汉字有多少分享:自编学汉字系统--汉字卡片,字帖打印,趣味汉语等
[合集] Let's play piano (转载)这里文化人多,帮我认个字“身小”
手机输入还可以孩子学中文是去中文学校还是用识字软件?
有人看 中国汉字听写大会 吗求教: E63 安装 FrontRouter 怎么不能显示中文?
据说以下汉字覆盖了90%的人名女子姓“suǒ”太生僻 无法办社保卡欲改姓
统计软件只要涉及的合理,肯定把文风体现出来男子名有生僻字办不了银行卡 律师建议诉讼解决
韩中日共用常见808汉字表即将出版山东200村民被迫改生僻姓
相关话题的讨论汇总
话题: 信息处理话题: 生僻字话题: 汉字话题: 汉字库话题: 频度
进入Zhejiang版参与讨论
1 (共1页)
r**********e
发帖数: 133
1
http://info.motherol.com/Info/job/lunwen/it/2006052795652_2.shtml
汉字的信息处理经过多年的摸索,冲破了以前汉字不能进入计算机的迷信,取得了
可喜的成绩,但离能完全满足实际使用的需要还有很长一段距离。
我们先回顾一下计算机中的字库,然后讨论生僻字的信息处理方法。
一、汉字库发展简介
汉字库通俗地说就是计算机软件系统中的汉字仓库,依据不同的标准,字库中汉字
的数量是不同的,以前的主要标准有:
1、GB 2312 汉字编码字符集
从1975年开始,我国为了研究汉字的使用频度,进行了大规模的字频统计工作,内
容包括工业、农业、军事、科技、政治、经济、文学、艺术、教育、体育、医药卫生、
天文地理、自然、化学、文字改革、考古等多方面的出版物,在数以亿计的浩瀚文献资
料中,统计出实际使用的不同的汉字数为6335个,而其中有 3000多个汉字的累计使用
频度达到了99.9%,而另外的3000多个累计频度不到0.1%,说明了常用汉字与次常用汉
字的数量不足7000个,这就为国家制定汉字库标准提供了依据。1980年颁布了《信息交
换用汉字编
1 (共1页)
进入Zhejiang版参与讨论
相关主题
山东200村民被迫改生僻姓有人看 中国汉字听写大会 吗
DS157 第6,7项,外公外婆的名字电脑打印不出来,怎么办?据说以下汉字覆盖了90%的人名
Note2的Google拼音很多常用字都找不到统计软件只要涉及的合理,肯定把文风体现出来
如何显示输入七万多汉字?zz韩中日共用常见808汉字表即将出版
曦曦这两天忙啥去了。分享:自编学汉字系统--汉字卡片,字帖打印,趣味汉语等 (转
(ZT) 常用汉字有多少分享:自编学汉字系统--汉字卡片,字帖打印,趣味汉语等
[合集] Let's play piano (转载)这里文化人多,帮我认个字“身小”
手机输入还可以孩子学中文是去中文学校还是用识字软件?
相关话题的讨论汇总
话题: 信息处理话题: 生僻字话题: 汉字话题: 汉字库话题: 频度