基于文档信息空间模型的词元权重调整

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:hl830320
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在Web文档信息检索中,文档分类、文档过滤的质量一直是影响用户查询结果的关键。这篇论文将通过分析一些典型的权重函数的构造,提出一个基于文档信息空间的权重函数来计算调整文档中词元的权重,使文档的分类和过滤效率更高。
其他文献
目的:探讨术前鞍区HRCT扫描在单鼻孔蝶窦入路切除垂体腺瘤中的作用:方法:回顾性分析42例经单鼻孔蝶窦入路垂体腺瘤切除病人鞍区薄层HRCT检查的结果和经验.结果:蝶窦呈鞍形35例,鞍
提出一种基于粗糙集的区间值属性决策表的有序规则获取方法。首先根据区间数之间基于可能度的序关系.将区间值属性决策表转化为二元决策表,然后利用粗糙集理论进行分析并推理出
通过对部分现有网络管理接口实现一致性声明文稿共性的分析,总结出了实现一致性声明文稿的分类和所应涉及的范围,提出了通用的一致性声明文稿的基本组成,并给出了其一般的定义原
滤波作为一种信号处理的方法,广泛地运用在许多不同领域。在逆向工程中,由测量数据建立的三角网格模型常常包含着各种噪声点。为了提高网格模型质量,常需要对网格模型进行光顺、
在并行计算机系统中,Mesh网络是最重要的网络拓扑结构之一。该文研究了基于结点出错概率Mesh网络的连通性,提出了k-Mesh子网连通的概念,运用严格的数学推理,推导出网络结点出错概
该文对信息搜索技术的发展和趋势作了一定分析,并讨论了当前半结构化决策树信息检索领域的先进抽取技术。从应用的角度提出一种新的半结构化决策树信息获取方法-MT,包括标准化
便秘是临床发生率较高的一种病证,主要表现为大便次数减少、时间间隔延长,粪质干燥、排出困难等。冠心病患者因为病程迁延难愈,病情严重者需要长时间卧床治疗,缺乏运动,部分
对于大规模无线传感器网络的路由协议进行了研究,提出了基于最小跳数的路由协议。详细介绍了最小跳数场的建立过程,从理论上证明了每个节点只会收到一个导致最小代价变小的信息
蓝牙协议定义了灵活的编码方案(检纠与纠错机制),可针对不同的链路质量选用不同的编码方案,并可映射到相应的数据分组格式上,这为可靠的通信提供了有力的保证。文章简要地分析了