【摘 要】
:
主题漂移和词不匹配是自然语言处理中一个难题,文本挖掘与信息检索的结合有助于解决该问题.鉴于此,本文提出一种基于完全加权正负关联模式挖掘的越-英跨语言查询译后扩展算法
【机 构】
:
广西跨境电商智能信息处理重点实验室培育基地(广西财经学院),广西财经学院信息与统计学院
【基金项目】
:
国家自然科学基金(No.61762006,No.61662003,No.61262028).
论文部分内容阅读
主题漂移和词不匹配是自然语言处理中一个难题,文本挖掘与信息检索的结合有助于解决该问题.鉴于此,本文提出一种基于完全加权正负关联模式挖掘的越-英跨语言查询译后扩展算法.该算法采用新的完全加权正负项集支持度和关联度计算方法以及模式评价框架,对初检用户相关反馈文档集挖掘与原查询词相关的正负关联模式,从模式中提取扩展词实现跨语言查询译后扩展.与现有基于伪相关反馈、加权关联模式挖掘的跨语言扩展算法比较,本文算法能有效地减少查询主题漂移和词不匹配问题,提高跨语言信息检索性能;本文模式挖掘方法可用于推荐系统,提高其准确
其他文献
莆田市城厢区是一个以农牧业经济为基础的新兴城区;由于人多地少,种植业受到一定限制,而畜牧业相对较为发达,尤其白番鸭养殖业是我区畜牧业的支柱产业,且养殖的历史悠久,经验丰富,年
养羊中难免有年老体弱、屡配不孕、种用性能差的母羊需淘汰,如能对这些淘汰母羊进行阉割育肥,便可大大地提高淘汰母羊的经济效益。笔者在阉割实践中比较了小挑花式和大挑花式两
本文利用全国海洋普查资料和中国邻近海域的断面调查资料以及有关的图集,分析了渤、黄、东海三个海域的季风气象学特征和夏季风在三个海区的北进过程。在此基础上,进一步说明了
产蛋母鸡抱窝停产既是一种生理现象,但也与营养、密度及周围环境变化有关。不存在明显的季节性和产蛋日龄限制,若任由抱窝母鸡恋巢不离,将给养殖户造成重大损失。2005年以来,我市
《连山》原书已散佚,清代马国翰在《玉函山房辑佚书》中辑录其佚文数量最多,共计15条。对这些佚文逐条考证可知,其中6条佚文来源明晰无争议,另有2条争议颇多但经考证应无误,
针对微博口语化、文本短小等特点以及现有研究的不足,本文提出了一种融合用户关系的自适应微博话题跟踪方法.首先,在当前跟踪的时间窗内,推文被映射到特征空间,并作为候选推
为实现遥感影像分割中类别数的准确、自动判别,提出了一种可变类谱聚类算法.根据影像的相似图构建权值矩阵和标准Laplacians矩阵,计算Laplacians矩阵较小特征值对应的特征向量生成特征向量矩阵,并视其与像素对应的向量行为像素特征点集;研究Laplacians矩阵处于不同(近似)块对角结构时类属同一目标类像素特征点的聚集性,定义聚类度指标,计算不同分割类别数对应聚类度;选择聚类度将发生最后一
马克思政治哲学的特质表达了马克思政治哲学与其他西方政治哲学以及与马克思主义其他领域的界分。它由"建立与共产主义政治行为相适应的正义原则与价值信念"为理论目标、"以
<正> 1989年9月~1990年2月,为支援边远贫困地区医疗工作在风台县农村流行性出血热(EHF)高发区共收治EHF258例,筛选出106例随机分为山莨菪碱组和强力宁组。两组病人均符合1985
在60cm×43cm的种植密度下,进行白顶2号、农大3138、中原单32三个青贮玉米品种的比较试验,结果表明:3个品种均能在闽清地区生长良好,以白顶2号青贮玉米表现较佳。它植株高大,