汉语交集型歧义切分字段关于专业领域的统计特性

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:wwchao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
交集型分词歧义是汉语自动分词中的主要歧义类型之一。现有的汉语自动分词系统对它的处理能力尚不能完全令人满意。针对交集型分词歧义,基于通用语料库的考察目前已有不少,但还没有基于专业领域语料库的相关考察。根据一个中等规模的汉语通用词表、一个规模约为9亿字的通用语料库和两个涵盖55个专业领域、总规模约为1.4亿字的专业领域语料库,对从通用语料库中抽取的高频交集型歧义切分字段在专业领域语料库中的统计特性,以及从专业领域语料库中抽取的交集型歧义切分字段关于专业领域的统计特性进行了穷尽式、多角度的考察。给出的观察结果对
其他文献
言路畅通,思想家辈出,是社会进步最显著的标志。百花齐放,百家争鸣,正是大变革时代的思想市场特征。只有思想市场繁花似锦,才能促使中国特色社会主义更加昌盛、更加辉煌。  中国的改革发展需要“思想市场”  改革时代是开放的时代,也应是思想最活跃的时代。  大变革解放生产力,不仅促进经济大发展,也必然涉及生产关系,触及政治体制、意识形态等等。改革在政治上是利益重组,要重新摆平各种复杂的社会关系,制度上要除
浅层狄利赫雷分配(Latent Dirichlet Allocation,LDA)方法近年来被广泛应用于文本聚类、分类、段落切分等等,并且也有人将其应用于基于提问的无监督的多文档自动摘要。该方法被
一场有关内容聚合的辩论在谷歌与德国几大出版商之间展开。许多互联网参与者都支持谷歌——他们似乎忘记了职业记者才是他们的天然盟友。
在印度的新德里,矛盾并没有被排解,而是深深扎根在那里。有一个神?三个神?很多的神?无数的神?是的,是的,是的。
1 病例摘要患者男性,18岁,因激动后心悸、胸闷、气促1年多来院就诊,查体:神清,BP100/70mmHg,心界不大,心律不齐,平均心率61次/分,未闻及病理性杂音,X线及超声心动图正常.
本文综合分析了网页内容块各方面的特征,提出了一个联合使用布局特征和语言特征的网页主要内容块发现方法,有效地解决了以往模型中通用性与高准确率不能共存的缺点。该方法使用
针对现有水合物动力学抑制剂存在的缺点,以Ⅳ-乙烯基吡咯烷酮为单体,双氧水为引发剂,在氮气作用下,采用溶液聚合法合成了一种动力学抑制剂,利用实验室水合物动力学实验装置,考察了
用19株抗鸡新城疫病毒(NDV)单克隆抗体(简称单抗)测定与14个NDV国际参考株和16个NDV国内分离株的反应性,将毒株分为a~h 8个群。该组单抗能较精细地测出流行病学上不同的毒株间
目的对273例严重胸外伤患者进行临床分析,探讨其早期诊治效果.方法总结我院1993年1月2002年6月收治的273例严重胸外伤患者,对其早期诊断与治疗进行分析.结果本组治愈255例,死
本文对国产三种剂型OPV进行了热稳定性试验,在所试温度中能保持疫苗有效服用剂的时间为:4℃ 4个月以上,10℃ 2个月,22℃ 7天,34℃ 2天,36℃ 1天。试验发现液体苗对热的稳定性