特征词提取相关论文
准确构建对信息检索有改善作用的检索式,需要在对检索结果聚类并在其前提取特征词,减少特征矢量空间维数,在其后为用户检索提供优......
针对当前的文本相似度检测方法忽略文档结构信息、缺乏语义关联性的问题,提出了面向文本的相似度检测方法。首先,采用层次分析法(A......
[目的 /意义]基于高维矩阵稀疏降维的思想,提出一种利用惩罚性矩阵分解(Penalized Matrix Decomposition,PMD)实现共词分析的新方......
随着互联网在我国的飞速发展,人们的生活也随之发生了巨大的变化。人们能够用越来越快的速度了解到我国甚至是全世界发生的各种各......
互联网快速发展,各类网络应用给大众生活带来便捷,同时也给网络监控和管理带来了巨大的挑战,如P2P应用流量逐年上涨,互联网服务提供商(......
搜索引擎是获取信息的有效工具,设计与实现搜索引擎是一项庞大的工程,要运用较多专业技术知识。本文力图通过实例分析,介绍搜索引擎的......
随着信息化进程在农业领域的推进,人们对农业生产过程相关的信息需求越来越多。本课题以果业为背景,针对果业种植过程中信息服务这一......
在线社交网络已成为信息时代人们沟通和交流的一个主要平台,微博在社交网络中占有重要的地位,已经成为社交网络中重要的媒体之一。......
微博作为一个新兴的社交媒体服务,从各个方面渗透并影响着人们的生活,成为人们共享信息、交流情感的一个重要平台。其中大部分的个人......
随着网络技术的发展和大众公共参与意识的提高,越来越多的人喜欢在网络上发表自己的评论,这些评论中包含了大量的有用信息。同时,A......
随着大数据时代的到来,文本数据呈现了爆炸式增长趋势,为了提高有效信息的获取效率,文本分类技术得到了迅速发展。新闻文本作为人......
随着互联网技术的不断发展和成熟,各种数字化信息的产生和发布速度呈爆炸式增长,海量文本数据占据较大比例。如何在海量文本数据中......
分类是自然语言理解的一个重要分支,本文使用知识和统计相结合的手段,对于文本而言,分别就分词后处理、特征词的提取与筛选、分类......
网页分类算法是目前比较热门的研究课题,目前已经有许多网页分类算法,其中TFIDF算法是一种用于信息检索与数据挖掘的常用加权技术,......
非功能需求描述系统质量相关的属性,是软件设计决策的重要依据和评估标准.与功能需求的描述相比,非功能需求描述通常比较分散,且往......
文本特征词提取是一种提炼文本重要信息的实用技术,同时也为文本聚类、自动分类、信息抽取等相关课题提供了技术支持。在规范文本......
评论挖掘是近年来自然语言处理领域研究的热点,为此重点研究评论挖掘技术中的评论特征词提取,采用基于语法模式的抽取方法从中抽取......
在特征词提取算法中,TF-IDF算法是最常见的特征权重计算方法.在传统TF-IDF算法的基础上,提出新的基于文本词语长度的关鍵词提取算......
特征词提取是一项提炼整个web页面内容的实用技术,同时也为文本分类,信息抽取应用提供了技术支持.在web页面内容上。利用段落间语义关......
报文聚类是报文格式推断的基础,现有的报文聚类方法大多以报文的全局相似性为聚类的标准,这类聚类方法的准确率往往不高,进而影响......
【目的】在共词分析时对高维共词矩阵进行稀疏降维,直观快速地凸显出高维矩阵中的核心特征词。【方法】提出基于惩罚性矩阵分解(PM......
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们......
摘要:目前,复杂设备系统故障信息多采用文字描述的形式进行记录和保存,累积产生的大量故障信息没有有效的应用到设备维修和实际应用......
消费者健康信息需求是指当患者或患者的亲戚出现自我感觉身体不适时,主动寻求相关健康知识以获取所需健康信息,以确定症状,排除忧......
随着近年来电子商务、社会化网络、移动互联网以及智能化技术的发展,互联网上的信息呈现出爆炸性增长的态势,通用搜索引擎的检索结果......
非功能需求描述系统质量相关的属性,是软件设计决策的重要依据和评估标准.与功能需求的描述相比,非功能需求描述通常比较分散,且往......
自动问答系统(Question Answering System,QAS)作为新一代的信息检索系统,是自然语言处理与人工智能相结合的产物,它允许用户使用......
当今世界是互联网的世界,越来越多的人们在互联网上通过社交网络分享信息,发布对产品的观点,每天都有海量数据存储于社交网络,如此......
随着科技和互联网技术的发展,人们可以获得的信息资源越来越多,但这些信息资源散布于各类数据库中,因此如何从各类数据库中挖掘信息......
在互联网上的文本信息量迅速增长的同时,人们对互联网上的信息进行查阅和整理所耗费的精力与时间也越来越多,在这种背景下,利用文......
随着网络的发展,电子邮件已经成为人们日常生活中不可或缺的通讯方式,电子邮件以其方便快捷的特点受到广大网民的青睐。电子邮件成......
针对微博短文本特征难以提取的特点,结合微博文本的3种专属特殊符号:"@"、"//"和"#"分析微博文本的特点,从而对TF-IDF算法进行改进,并且考......