论文部分内容阅读
总结了《中文生物医学期刊数据库》(CMCC)的汉字缺失现象及其成因,提议:在逐步更新数据库时,立即使用GBK扩充汉字批量替换大部分缺失汉字;安装微软GB18030支持包及Surrogate更新,升级数据库的开发和应用平台。使之完全支持GB18030大字符集;将来采用ISO10646为构建CMCC数据库的中文字符编码标准,从而完全支持7万字以上的SuperCJK超大字符集等。