【摘 要】
:
根据中文古籍信息检索技术的需求 ,本文在大规模语料库上对古汉语进行了统计分析。首先给出了在信息处理中多个专用语料库的动态知识合并的方法。在此基础上 ,对三千五百万字
【机 构】
:
智能技术与系统国家重点实验室清华大学计算机科学与技术系,智能技术与系统国家重点实验室清华大
【基金项目】
:
国家重点基础研究项目 (973) (G19980 30 5 0 9);自然科学基金项目:(6 9836 0 40 )
论文部分内容阅读
根据中文古籍信息检索技术的需求 ,本文在大规模语料库上对古汉语进行了统计分析。首先给出了在信息处理中多个专用语料库的动态知识合并的方法。在此基础上 ,对三千五百万字的中文古籍语料进行了统计分析 ,总结出在古汉语中 ,汉字在高频字上集中分布而在低频字上相当散布 ,且总体变化成指数递减的规律 ,并对二元语法进行了分析。然后分别与现代汉语的单字及双字进行比较 ,得出相应结论 ,并按照使用频度 ,把古汉语的汉字进行了分类。最后 ,这些统计学习到的知识 ,在中文古籍信息检索系统中得到了实际的应用
其他文献
本文主要介绍了桐柏月河一号春秋墓出土玉器阴刻技术的微痕研究情况。根据6件典型玉器所开展的阴刻纹饰的微痕观察,初步判断春秋晚期玉器阴刻工艺已成熟使用了添加解玉砂的旋
介绍两段氨吸法回收硫酸尾气SO2副产固体亚硫酸铵的生产原理,工艺指标的控制方法以及设备和工艺流程。装置运行可靠,各项技术经济指标较优。SO2总吸收率达97%以上,每年少向大
本文依据待校对文本中的常见错误类型介绍了纠错知识库的构造方法以及基于该纠错知识库的自动纠错算法。该算法通过利用出错字串的特征 ,结合上下文启发信息 ,可有效地对文本
通过对吉林省民营企业的现状分析,得出吉林省民营企业目前发展中所存在的问题和隐患,并通过资本报酬率的理论分析来解释诸多问题和隐患的原因,并提出解决办法。
<正>一、我国钢铁产业组织现状(一)企业生产规模显著提高近年来,受我国城镇化、工业化进程的加快,以及房地产和汽车消费升级的带动,我国钢铁需求持续旺盛,钢铁工业总体规模迅
自攀枝花建市以来,攀枝花的书法创作也伴随着这个城市的文化发展进程慢慢发展起来。$$上个世纪80年代前后,书法作为一种艺术爱好,大家注重的是对传统的继承和学习,没有急功近利的
【正】 从各地成立乡镇司法办公室的情况看,有以下几个问题值得探讨。一、乡镇司法办公室属什么性质的机构?一是认为属群众性的服务机构,一是认为属乡镇政权的司法行政部门。
在桂林岩溶区的岩土工程勘察中,地基稳定性评价应注意考虑溶洞或土洞的规模尺寸、形态、洞内充填物、地下水等因素的影响;石灰岩、粘性土、粉土的地基承载力应采用多种方法综合
公平与效率是我国教育资源配置一直追求的目标,它能有效推动教育事业快速健康发展,为我国经济社会可持续发展奠定坚实基础。本文通过阐述教育中公平和效率的内涵,结合我国的
面齿轮具有动力分流好、承载力强、质量轻的独到之处,广泛应用于航天航空事业。由于面齿轮的齿面形状复杂,其齿面精度自始至终是加工制作中的一个关键问题。面齿轮加工制作过程中,齿面粗糙度的减少会使得面齿轮在机械传动过程中啮合精度提高。为提高齿面精度,本文对面齿轮高速铣削加工方法和齿面粗糙度进行了研究,主要内容如下:对面齿轮高速铣削技术、高速铣削齿面粗糙度形成原理以及其主要影响因素等进行了简要的分析。根据微