【摘 要】
:
以基于机器学习的指代(Anaphora)消解平台为基础,研究代词待消解项识别问题。挖掘能区分代词是否为待消解项的特征集,总结归纳具有规律的代词待消解项的句法结构,使用机器学习的方法将二者结合生成代词待消解项过滤器并将其加入到代词指代消解平台。在ACE2003基准语料上测试过滤器自身性能及对代词指代消解的贡献。实验表明过滤器具有较高的准确率,能明显地提高代词指代消解系统的性能。
【机 构】
:
苏州大学计算机科学与技术学院,江苏省计算机信息处理技术重点实验室
论文部分内容阅读
以基于机器学习的指代(Anaphora)消解平台为基础,研究代词待消解项识别问题。挖掘能区分代词是否为待消解项的特征集,总结归纳具有规律的代词待消解项的句法结构,使用机器学习的方法将二者结合生成代词待消解项过滤器并将其加入到代词指代消解平台。在ACE2003基准语料上测试过滤器自身性能及对代词指代消解的贡献。实验表明过滤器具有较高的准确率,能明显地提高代词指代消解系统的性能。
其他文献
全国挑战杯大学生创业设计大赛辽宁省竞赛铜奖获得者孙冬冬,利用网络优势成立了沈阳地区第一家团购网站,目前他已拥有加盟企业五十家,会员5000人。一个原本对网页设计一窍不
这是一种以争先为胜的多人玩扑克游戏。玩法及规则非常简单,但并不意味着不需要动脑筋,实际上要想取胜,还得根据手中牌的情况,随机应变才行。
<正>第十届中国科协年会(以下简称'年会')将于2008年9月17—19日在河南郑州市召开,由中国科协和河南省人民政府联合主办,主题是'科学发展与社会责任'。年会
春秋末期,有一个非常重要的社会现象, 那便是刺客的涌现。这是一批生活在民间、不图富贵、崇尚节义、身怀武艺的武士。他们与某些权贵倾心相交,为报知遇之恩而出生入死, 虽殒
2007年2月在玉溪农职院科技同引进8个省外优良脱毒甘薯新品种苏薯8号、鄂薯3号、鄂薯4号、鄂5205、渝薯153、渝薯162、渝薯123、渝I2-8进行产量和品质测定,并以当地板栗甘薯为
昨天午休时,同事小张坐在自己养的那株兰草前,神情专注地轻轻抚摸着它的叶子。大家正纳闷,小张笑笑说:"这是我总结出的养植物秘诀。其实养植物跟养孩子一样,要像爱抚孩子一样
历史上许多科学家取得了科研成果之后,科研成果的命运都受到语言表达能力的严重影响。不论是口头的语言表达, 还是文字的语言表达,对科研成果的命运都具有不可估量的影响。下
很多喜欢运动的中学生为了加强力量训练,在自己的脚腕上绑沙袋。专家认为,将具有一定重量的沙袋绑在腿上进行锻炼,能够起到锻炼腿部肌肉力量的作用。但是,沙袋重量并不是越沉
为了研究应变率效应对整车侧碰仿真的影响,建立了某紧凑型轿车侧面碰撞有限元仿真模型,对侧碰分析影响较大的关键零部件进行了不考虑应变率效应和考虑应变率效应的侧碰仿真计算,在侧围变形、B柱加速度及侧碰性能指标——关键部位的侵入量与侵入速度等方面与实验结果进行了对比,表明材料的应变率效应对整车侧碰仿真有较大影响。
文本聚类是指自动地将文本集合分组为不同的类别,应用非常广泛。研究发现,传统的TFIDF文本分类方法存在很多的不足,针对这些不足提出改进。通过使用循环迭代算法根据特征词在类内和类间的分布情况不断优化特征词的选取,获得不断改进的分类。采用支持向量机分类器对文本分类。通过对大批量的数据集测试,该算法显示出较好的特征选择效果,能够有效地提高分类精度。