基于《(知网〉》词汇语义相关度计算的消歧方法

来源 :情报学报 | 被引量 : 0次 | 上传用户:woaiwodeqq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
歧义字段的处理是汉语自动分词系统中重要而困难的问题之一。歧义处理正确率的高低直接影响着分词的质量。为了解决汉语自动分词系统中的歧义问题,本文基于《知网》的义原关系,在分析了影响词语语义相关度的主要因素后,引入相关度计算,利用《知网》中义原之间的纵向和横向关系及实例因素计算出不同词性的相关度,根据相似度的对称性计算实例的影响因素,由此来提高语义相关度的准确率,同时针对所提出的方法给出了实例验证。实验结果表明,该方法计算得到的语义相关度结果更加合理,为消除汉语自动分词中的歧义问题提供了良好的支撑依据,也使得汉
其他文献
<正>原发性血小板增多症(essential thrombocythemia,ET)属于ph阴性的骨髓增殖性肿瘤中最常见的类型,以骨髓巨核细胞过度增殖、外周血血小板持续增高为特征,血栓与出血是临床
IT圈中来自宝岛台湾的人已经是越来越多。如果说“进入大陆市场”是第一阶段,那么现在的他们已经开始了第二阶段的“融入”。在华硕的许佑嘉和友讯的李伟那里,个人生活、职业
期刊
<正> 一石激起千层浪,几天前刚出台的《关于调整证券交易佣金收取标准的通知》,使得如何提高自身竞争能力成为各证券公司的生死抉择问题。而WTO之后外资券商在业务项目和人才
为了深入分析非线性评价带来的评价结果实际差距扭曲问题,本文采用回归分析法将非线性评价转换为线性评价并进行深入分析。研究结果表明,不同评价方法评价结果的用途不同,基
本文通过引入知网的概念,对传统的K-means聚类算法进行了分析,初始聚类中心的选择对聚类结果有较大的影响,初始值选择的不好,可能无法得到有效的聚类结果,这也成为K-means算法的一
本文提出了知识元标引的新概念,认为知识元标引是实现跨领域知识集成与知识发现的基础。对文本知识元类型,标引规则,人工知识元抽取,软件知识元抽取,人工知识元修改,知识元面向对象
叙事中的根本问题是时间问题。叙事内部的"被叙述的时间"左右着接收者对"文体"的判断,并以其独有的"时间的权力"间接促成了针对一次叙事行为在整体历史中的位置的标定。民间文学中
回顾2001,展望2002,围绕着互联网所展开的市场变迁正在悄然进行,一批以新时尚、新需求引发的热销品正在走向成熟。周刊将继续为互联网时代的大市场推波助澜,为更广大的使用者
目的讨论腹腔镜左肝外叶切除术在临床上的应用效果。方法以我院2014年3月—2015年12月收治的60例肝内胆管结石患者以及肝血管瘤患者作为研究对象,随机将其分为对照组和观察组
<正> 国内各界对有关商业方法专利的普遍关注,是从2002年9月因一家大众型报纸对美国花旗银行对十九项涉及“商业方法“的专利申请的报导开始的。事实上,涉及“商业方法专利”