基于概念的文本类别特征提取与文本模糊匹配

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:btly540205390
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本信息特征提取和文本分类是当前智能信息服务系统基础研究的重点。该文给出一种新的类别特征提取与文本匹配方法。首先对术语特征权进行了综合计算,然后基于概念网络术语--概念映射关系,将特征权由术语空间转换到概念空间并做权值限幅处理。在此基础上,通过对概念进行类内和类间的统计分析,得到类别特征的均值与方差两个向量,通过模糊距离计算技术文本进行类别匹配。该文方法克服了传统IDF方法缺点,能有效地从概念上提取文本类特征,提高文本自动分类的准确性。
其他文献
我国是一个农业大国,农业在整个经济社会的发展当中处于基础性地位,只有农业生态文明取得实际成效,整个社会的生态文明才能够有质的提高。农村生态文明是一项综合性的文明成
结合桂林地区的气候条件,介绍了桂林地区番茄避雨栽培管理技术,从避雨棚的搭建、番茄的栽培和病虫害防治技术等方面进行了总结,以期为当地番茄生产的健康发展提供参考。
设素数p≥ 3,对模p的任一原根x,且1≤x≤p,一定存在模p的唯一的原根x^-且1≤x^-≤p,使得xx^-≡1(modp),若x与x^-具有相反的奇偶性,则x就称为Lehmer DH数,本文利用广义Kollstermann的
提出求解混合变分不等式的一个新的迭代算法1,并且当f是非空闭凸集K上的指示函数时,得到求解经典变分不等式的迭代算法2.对于算法1,在假设混合变分不等式的解集非空及不需要limn
MANET是由一系列可以自由移动的节点主机聚集而成的一个临时性动态网络,它没有固定基站,也没有作为控制管理中心的节点主机,由于其拓扑的动态性,其路由协议不同于其它网络,为更有
介绍了存储局域网(SAN)和附网存储(NAS)特点,讨论了网络存储的发展趋势--基于IP的存储网络技术,并与光纤通信(FC)协议的存储局域网作比较,分析其优势,另外讨论了基于IP的存储网络的关键技
过敏性紫癜肾炎的诊断及治疗南京金陵医院解放军肾脏病研究所尹广,黎磊石过敏性紫癜是一种与免疫异常有关的系统性小血管炎性疾病,临床上以皮肤紫癜,出血性胃肠炎,关节炎及肾脏损
随着现代信息技术的发展,"互联网+高等教育"成为教育新形态,微信为多样化的学习方式、便利的师生交流互动和发布最新的学习资源提供了平台。文章从学生的学习兴趣、特点出发
研究不同红蓝绿光质比LED灯源(Light Emitting Diode)对马铃薯试管苗生长的的影响,为马铃薯试管苗生产提供理论依据。以马铃薯试管苗为试材,选择6个不同LED光质组合作为处理,培养