基于加权向量空间模型的网络搜索

来源 :计算机应用研究 | 被引量 : 5次 | 上传用户:zhangnaiyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了高效地对从Internet上获取的文档进行训练并归类,给出了一种新的分类器模型。该模型在传统的向量空间模型(VSM)中引入了关键词语的加权因子,并在训练文档过程中对文档类型特征向量进行动态优化。这在一定程度上恢复了关键词语实际应具有的权值,方便了阈值的选取,使分类更加准确和高效。实验表明,该分类器分类合理、分类准确性有明显的提高,并具有一定的学习功能。
其他文献
针对目前网络化制造环境下,服务描述、发现过程中语义信息动态表达不足的问题,从Web服务的角度提出了一个基于本体的制造服务知识建模方法,并在此基础上构建制造本体模型,最后给出服务模糊匹配的评定方法。重点研究解决了制造服务过程中不同对象间的信息交流、数据交换和知识资源重用三个问题,有效地实现网络制造环境下资源共享与优化配置,为语义Web的网络协同制造服务平台的构建奠定了基础。
为高效求解多目标组合优化问题,提出一种进化计算与局部搜索结合的多目标算法。此算法基于个体排序数和密度值进行适应度赋值,采用非劣解并行局部搜索策略,在解的适应度赋值和局部搜索过程中使用Pa-reto支配的概念。实验结果表明,新算法不仅提高了优化搜索的效率,且能够找到更多的近似Pareto最优解。
针对3-状态隐马尔可夫模型(hidden Markov model,HMM)预测蛋白质二级结构准确率不高的问题,提出15-状态HMM,通过改进的算法与BP神经网络相结合进行二级结构预测。研究对象为CB513数据集中筛选出的492条蛋白质序列,将其随机均分7组。应用混合模型进行预测,对准确率进行7-交叉验证,Q3准确率达77.21%,SOV值为72.52%。结果表明,混合模型既能充分考虑相邻氨基酸残
基于序列分形自仿射特性,提出一种实现一维信号分形维数估计的方法。按不同尺度将信号序列分段为映射区间和象区间,采用搜索算法确定与各象区间最优匹配的映射区间,并根据迭代函数系统理论估计信号的分形维数。以分形维数已知的Mackey-Glass和Lorenz信号为例,仿真表明提出的方法能准确估计信号的分形维数,对实际应用具有一定的参考价值。
广西高等教育学会章程──(1993年12月24日第三届会员代表大会通过)一、广西高等教育学会是广西壮族自治区研究高等教育科学的全区性群众学术团体,是中国高等教育学会和广西社会科学联合
职业大学食品与发酵专业设置新产品开发实验课属首次提出,文章论述了职业大学食品与发酵专业设置新产品开发实验课的目的、意义,必要性及可行性,并介绍如何进行新产品开发实验课
农业高校的专业保实践性教学是培养学生综合运用能力的关键。因此,应重视实践再现与理论分析相结合;基本操作与技能训练相结合;问题的提出与专业讨论相结合。并根据实践教学内容
本文阐述了教育学院课程设置改革的重要性,介绍了广西教育学院课程设置改革的情况,分析了成人高师课程设置中的优点与不足,提出了进一步改革教育学院课程设置的思路和设想。
通过分析在实际工作流中易出现的复杂模式,探究了以往文献中的重构算法不能处理这些模式的原因。通过对算法进行修正,使该算法能够对复杂模式进行有效处理。通过实验证明,改进后的算法仍能保持良好的性能,适用性较强。
本文主要是叙述作者对部分英语基础差的学生,实行因材施教,有针对性的进行补习与辅导。