对称与非对称:中文词义消歧中局部上下文窗口问题研究

来源 :情报学报 | 被引量 : 0次 | 上传用户:ghostraider
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
词义消歧是一个分类过程,局部上下文是主要的分类特征。对称窗口指上下文边界与歧义词的左右距离相等,大部分消歧系统凭经验将其作为最优的局部上下文窗口,很少选择非对称窗口。对称窗口是否优于非对称窗口?本文以Senseval-3中文数据集为例对这一问题展开研究。首先,对训练集采用交叉验证法确定最优窗口,它是非对称的。并采用此非对称窗口与多组经典的对称窗口进行了对比消歧测试,结果表明非对称窗口的表现优于对称窗口。进一步在独立采用词或词性作为特征的情况下进行交叉验证评估,发现趋于对称的窗口总体上表现是优秀的。在不进行
其他文献
目的:分析HLA-Ⅰ类血清学分型误定规律,研究HLA-A,B位点基因分型方法,提高移植配型的准确性.方法:应用聚合酶链反应-序列特异性引物(PCR-SSP)技术,检测180例骨髓资料库中已用
日前,上海西站的南北通道、南广场已开通运行。开放前夕,“上海西站绿色低碳交通枢纽建设关键技术研究与集成示范”课题通过市科委验收,标志着全国领先的绿色低碳交通枢纽建成,预
查询结果合并是分布式信息检索中的一个重要步骤,其合并方法的选择直接影响检索结果的质量。本文首先对两种查询结果合并算法,即经典的CORI算法与新近提出的回归分析与选择下载
中国商飞结合当前行业内外生态技术发展前沿,积极探索实施“绿色商飞”行动计划,在产品全生命周期中贯彻“绿色发展”理念,以应对环境挑战,最终实现环境友好。中国商飞大力推动技
近年来许多中等学校升格为专科院校,我校也于2003年4月由原广东省梅州市卫生学校升格为嘉应学院医学院.并于同年9月份招收普通高考的大专护生,大专护生的入校对中专护生冲击
随着网络技术的快速发展,社交网站为广大用户提供了一种全新的交流和信息分享的平台,深受网友的欢迎。本文探讨了社交网站的交互模式,以测试来自传统物理世界的成本、互惠性、三
本文基于竞争情报领域研究生教育培养视角,从学科体系、学科在国内外的发展、社会对学科的人才需求、独立设置二级学科的必要性和可行性、设置二级学科后的发展前景5个方面,论
根据市政府与区政府签署了《打赢蓝天保卫战目标责任书(2018—2020年)》,青浦区将各街镇、青工园、西虹桥的任务分解至三年,2018年完成20%、2019年完成50%,剩余的在2020年10月1日之
从Egghe-Rousseau模型和Glanzel-Schubert模型出发,推演出h指数与总被引次数C之间的幂函数关系模型(即h-C幂律关系模型),此模型与之前的实证结果相符。模型中幂指数最大值为0.5
本文提出一种面向聚类主题的文本特征表示方法,即以聚类的主题概念来刻画文本的特征向量,将文本描述提升至语义层次。首先,通过聚类,形成一组以向量形式表达的隐含主题概念,