【摘 要】
:
提出了一种新的文档自动摘要方法,利用非负矩阵分解算法将原始文档表示为若干语义特征向量的线性组合,通过相似性计算来确定与用户查询高度相关的语义特征向量,抽取在该向量上具有较大投影系数的句子作为摘要。在此过程中,多次采用相关反馈技术对用户查询进行扩展优化。实验表明,该方法所得摘要在突出文档主题的同时,体现了用户的需求和兴趣,有效改善了信息检索的效率。
【基金项目】
:
国家自然科学基金资助项目(60673060)
论文部分内容阅读
提出了一种新的文档自动摘要方法,利用非负矩阵分解算法将原始文档表示为若干语义特征向量的线性组合,通过相似性计算来确定与用户查询高度相关的语义特征向量,抽取在该向量上具有较大投影系数的句子作为摘要。在此过程中,多次采用相关反馈技术对用户查询进行扩展优化。实验表明,该方法所得摘要在突出文档主题的同时,体现了用户的需求和兴趣,有效改善了信息检索的效率。
其他文献
针对普遍使用的线性搜索报文分类方法在时间效率方面的固有弱点,设计了一种依据数据流统计特性的规则集自适应动态优化算法。其中包括:规则权重计算、规则优化排序、动态触发优化等部分。在占用较少资源的情况下,较为有效地提高了系统性能,并经实验结果证明,应用效果良好。
针对当前流行的破解有线等效加密无线局域网密钥进而盗用上网资源的现象,研究了相关产品的攻击手段。对其提供的交互式重放攻击、ARP注入攻击、chopchop攻击和分片攻击四种攻击方式,通过跟踪记录攻击过程,分析了它们的攻击原理。在借鉴KDD99等特征提取方法的基础上,提取了9个用于识别攻击的流量统计特征,并利用支持向量机设计了入侵检测方案。实验结果表明,所提方案具有较高的检测率,能够有效检测入侵行为,
Δ-tree是一种新提出的多层索引结构,能够加速主存环境中的高维查询。在该高效主存索引的基础上,提出了改进的KNN搜索算法BU_DF_knn_Search,该算法通过定位技术、自底向上、深度优先遍历及过滤策略设计而成,解决了KNN查询中搜索半径未知的难题。在高维数据集上进行了实验,结果显示算法BU_DF_knn_Search比Δ-tree已有的KNN搜索算法具有更高的效率。
本刊讯 南京轻工业机械厂焦选生厂长于2008年三季度起,分别主持召开厂长办公会、各部门主要负责人会议和经营、生产、设计、财务、供应等系统负责人专题会议,对当前的市场和生
目前较常用的热数据识别方法主要关注于数据的访问频繁度,却没有有效地体现出访问次数随时间的变化关系,从而造成了较高的错误识别率。针对这种不足,设计了基于队列计数的热数据识别方法,通过使用先进先出规则淘汰过时的数据,并赋予队列中每个位置所存放元素不同的权值来表示不同时刻各数据的热状态;同时结合Flash读写等特性,引入了热区域概念,使其所需存储空间大大降低。通过理论分析以及实验证明,此方法在热数据识别
研究了相关免疫布尔函数和弹性布尔函数的平方和指标和绝对值指标,得到了满足p次扩散准则、次数为d的弹性布尔函数的绝对值指标的一个新的下界。同时,利用最大的W alsh谱值得到了此类函数的非零自相关函数数目的一个下界。
综合利用小波变换和张量主成分分析这两个算法的优点,提出了一种新的人耳识别方法,对人耳图像先采用小波变换作预处理得到四个子带图像;然后对每个子带图像用张量PCA进行特征提取;最后利用最近邻的方法实现人耳图像识别。实验结果表明,利用此方法与只用主成分分析识别相比,提高了识别率。
现代生产中的大量生产数据蕴藏着丰富的生产过程和质量信息,通过聚类分析可以了解生产状态,进行生产故障诊断或有针对性的质量检测,而经常使用的相似性的度量欧式距离只能反映数据空间分布为球形或超球形的结构特性。难以刻画复杂数据分布特性,将流形距离引入到生产过程状态的聚类分析中,利用标准数据、田纳西—伊斯曼过程和热轧带钢实际生产过程数据对方法的有效性进行验证,进而可以更加有效地了解生产过程的状态。
为优化返工情况下产品开发项目的流程,分析了基于优先规则的启发式资源分配规则的优点和不足,提出了基于信息流的资源分配规则,并利用仿真实验对资源分配规则的有效性进行了检验。仿真结果表明,提出的资源分配规则相对于基于任务顺序分配资源的优先规则和秩最大位置权重资源分配规则,能够更显著优化项目的执行时间和费用。
为准确判断网民言论与所关注话题的相关性,根据输入的关键词,运用查询扩展技术设计特征项提取和赋权算法,构造了话题向量空间模型,并提出网络舆论话题相关性算法。通过仿真实验验证话题相关性算法的有效性。该研究成果对于网络舆论分析具有应用价值。