基于LCS的中文缩写字段匹配问题的研究

来源 :山东科学 | 被引量 : 0次 | 上传用户：ray361

【摘要】

：

鉴于中文字段匹配在信息检索领域的重要性以及日益复杂的检索需求，本文首次提出并实现了基于最长公共子序列LCS的中文缩写字段匹配模型，避免了繁琐的分词操作，将字段匹配过程简

【作者】

：

邢晓辉刘慧

【机构】

：

山东省人民检察院信息中心,山东经济学院计算机科学与技术学院

【出处】

：

山东科学

【发表日期】

：

2008年4期

【关键词】

：

信息检索中文缩写字段匹配最长公共子序列分词 information retrieval Chinese abbreviation field match

【基金项目】

：

国家自然科学基金项目（60603077）,山东省自然科学基金青年基金（Q2007G04）,山东省教育厅科研计划项目（J07YJ11）.

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

鉴于中文字段匹配在信息检索领域的重要性以及日益复杂的检索需求，本文首次提出并实现了基于最长公共子序列LCS的中文缩写字段匹配模型，避免了繁琐的分词操作，将字段匹配过程简单化。在CWT100G数据集部分网页上的实验表明，该方法性能比较稳定，检索效果比较好，尤其在较长缩写字段的匹配方面效果更优于传统的基于字符串匹配的分词模型。

其他文献

中国传统花卉植物纹样在新中式家纺中的新式应用

当今是个多元的时代,快节奏的生活,使现代风格大行其道,但有些人不满足于现代风格底蕴的苍白,想赋予其一定的文化内涵;部分接受传统中式风格的人也不满足其复杂繁琐和功能上

期刊

现代风格新中式风格植物纹样古典与现代快节奏文化内涵

天然产物抗血管生成的研究进展

抗血管生成治疗已成为恶性肿瘤治疗的重要途径。本文对近年来抗肿瘤血管生成的天然产物研究进行了归类,已有研究发现萜类、酚类、黄酮类、生物碱类和蒽醌类等天然产物有抑制

期刊

天然产物血管生成natural products angiogenesis

耐蚀阀门壳体用钛材材料浅析

对钛材耐腐蚀性进行了简述,对耐蚀钛阀壳体用中美钛材成分和力学性能进行了对比分析,对耐蚀钛阀壳体选钛材给出了建议。

期刊