基于LCS的中文缩写字段匹配问题的研究

来源 :山东科学 | 被引量 : 0次 | 上传用户:ray361
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
鉴于中文字段匹配在信息检索领域的重要性以及日益复杂的检索需求,本文首次提出并实现了基于最长公共子序列LCS的中文缩写字段匹配模型,避免了繁琐的分词操作,将字段匹配过程简单化。在CWT100G数据集部分网页上的实验表明,该方法性能比较稳定,检索效果比较好,尤其在较长缩写字段的匹配方面效果更优于传统的基于字符串匹配的分词模型。
其他文献
当今是个多元的时代,快节奏的生活,使现代风格大行其道,但有些人不满足于现代风格底蕴的苍白,想赋予其一定的文化内涵;部分接受传统中式风格的人也不满足其复杂繁琐和功能上
抗血管生成治疗已成为恶性肿瘤治疗的重要途径。本文对近年来抗肿瘤血管生成的天然产物研究进行了归类,已有研究发现萜类、酚类、黄酮类、生物碱类和蒽醌类等天然产物有抑制
对钛材耐腐蚀性进行了简述,对耐蚀钛阀壳体用中美钛材成分和力学性能进行了对比分析,对耐蚀钛阀壳体选钛材给出了建议。
肇始1996年底,各地开通信息港。随着电脑硬件的迅速降低和行业竞争的逐渐激烈,网吧如雨后春笋般开始涌现,消费价格也迅速平民化。1997年,西安市邮政公司依托中国电信,成立了
空间信息作为提升国家治理现代化水平、保障和改善民生、推动大数据产业和数字经济创新发展的关键,正在成为世界主要国家和地区竞争的重要战略资源。而强大的空间信息产业则
通过构造逼近序列,利用Moench不动点定理得到了二阶奇异积分-微分方程边值问题解的存在性.
陆上交通靠车马,水上交通靠舟船。历经沧桑的我国古代造船业在当时是雄踞世界前列,西方欧洲也是望尘莫及。