基于词关联度的文本检索系统

来源 :微型电脑应用 | 被引量 : 0次 | 上传用户:hwangh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于对语料的统计分析,提出了词关联度的概念。通过对文本库中词语出现的频率,以及任意两个词语共同出现的频率进行统计,获得了各个词语之间的关联度,并使用这一参数对语义向量进行调整,可以有效地解决传统向量空间模型的单词依赖问题。结合倒排索引技术,实际建立了一个相当规模的文本检索系统。测试结果表明,系统具有较好的效果和良好的性能,具备实用价值。
其他文献
在新的增材制造技术领域中,増材制造加工的零件必须准确的定位在机床加工空间内部。为此,机床设备生产厂家采用了两轴的可倾式回转工作台来满足新增材制造技术的需求。
基于数字射频存储器(DRFM)的切片式干扰同时兼具压制性和欺骗性的特点,对雷达的目标检测造成巨大威胁.为此提出了一种基于时域滤波信号重组的抗切片式干扰方法.首先针对噪声
作为一家技术导向型公司,罗姆(Rohm)在机床精密夹具领域有着非常丰富的经验和广泛的产品线。针对CIMT2019,罗姆带来其卡盘系列、中心架和钻夹头等多款创新产品,吸引了数量众
目的观察在局部静脉麻醉下进行肘关节手法松解后康复锻炼的效果。方法肘关节功能障碍者80例,随机分为局部静脉麻醉组(局麻组)和非局麻组各40例,每2周行手法松解及手法辅助下肘关
基于复杂网络,将拓扑网络中的相关概念在交通网络系统中的含义进行了解读,总结了近几年交通网络模型的发展,给出了加权复杂网络城市交通关键路段识别和交通网络事故致因分析
我国社会正处于工业化蓬勃发展阶段,但同时我们也面临着严峻的环境污染问题,土壤污染就是其中一项。近年来,土壤污染事件发生率呈现上升趋势,特别是重金属对土壤污染问题尤为
目的:探讨臂丛神经扫描方案以及臂丛神经在各个序列上的不同影像学表现。方法:对11例健康志愿者的双侧臂丛神经进行MRI扫描,其中扫描序列包括:常规T1WI、T2WI、薄层无间距STI
采用以地震震级-频度关系和贝努利随机独立试验模型为基础建立的地震震级概率预测方法,对2005年前中国大陆各地震带的地震危险性进行了预测.结果表明,2005年前,中国大陆东部各地震带发生5级
从咸阳职业技术学院'多媒体应用技术'教学工作的实际情况出发,以及为了加强学生对'多媒体应用技术'学习的深度和广度,提出了基于J2EE的网络教学平台的学习模
随着嵌入式系统的不断发展,传统的嵌入式开发已经远远不能适应新的要求,需要借助UML强大的系统设计能力来解决效率低下的问题,但是标准UML在多系统级任务并发,任务之间同步、