基于文本挖掘的Web信息检索研究

被引量 : 0次 | 上传用户:zl6273008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Internet中的信息越来越丰富,使得搜索引擎准确率不高等问题愈发严重。本文对如何利用文本挖掘技术解决Web信息检索中准确率不高等问题进行研究。本文详细阐述了Web文本挖掘尤其是Web文本聚类技术,Web信息检索原理,以及Web文本模型。针对Web文本的特点,对向量空间模型进行了改进。结合模糊C-均值聚类与自组织映射神经网络,给出了一种改进的模糊自组织映射神经网络聚类算法。最后应用改进的模糊自组织映射神经网络算法,实现了一个聚类搜索引擎实验系统,验证了上述模型与算法对搜索引擎准确率的提高。
其他文献
目的:测定三个不同产地天麻中天麻素含量。方法:采用HPLC法测定三产地天麻中天麻素的含量。Agilent TC-C18色谱柱(4.6mm×250mm,5μm);流动相:乙腈-0.05%磷酸(4∶96);流速:1.
经过20多年的实践和探索,我国高等职业教育已取得了巨大的成就。它为我国培养了大批的应用型技术人才,有力地促进了经济和社会的发展,在我国的高等教育领域里形成了半壁江山,
近年来,随着自然灾害和突发事件的频繁发生,城市应急越来越受到人们重视。而道路交通作为城市生命线的一部分,对应急时的人员疏散和紧急救援都起到至关重要的作用。此时,准确
旅游合同研究,是目前我国法学研究领域相当薄弱的环节,这种情况与当前中国蓬勃发展的旅游市场极不相称。所以笔者尝试研究旅游合同的若干问题,主要针对旅游合同中典型的、争议大
本文首先提出随着经济全球化进程的加快,企业竞争日趋激烈,提高企业管理水平、缩小与外国企业之间的差距,成了我国企业目前最紧迫的任务。科学的需求预测,合理的生产计划,有利于企
<正> 本文要讨论的是考古学家在开展社会考古学研究时引发的问题(我在这里用"社会考古学"这个术语指代的是对于古代社会中权力和不平等的研究):即依赖考古资料进行分析的考古
多年以来,我国的民营企业一直表现出“长不大”的特点,这与民营企业的家族式治理模式是分不开的。由于我国传统文化背景的影响,加上一些历史的和现实的原因,使得家族式治理模
从1998年至今,国内证券投资基金的数量和规模分别从零发展到今天的90多只,1700多亿元,资产规模蔚为可观,基金品种也日渐丰富,投资风格也更加多样化。然而,国内基金业目前还没
随着以CT、MRI技术为代表的现代医学影像技术的发展,人体组织、器官的活体几何特征测量得以实现。本论文研究课题作为国家自然科学基金资助项目:“头部损伤的生物力学造型与