空间向量模型相关论文
针对数据驱动网络加密性能较差,攻击检测率较低的问题,设计基于云计算的数据驱动网络安全防御技术。基于数据驱动网络的数据捕捉模型......
本文首先基于类别概念,讨论了文本自动分类中文档类别间的关系,在此基础上对文本自动分类的定义进行补充说明,并讨论了文本自动分类中......
近些年来,许多研究机构都在加大信息过滤、信息分类等方面的研究力度。尤其在信息安全问题日益凸显的今天,我国的信息安全战略也在......
近年来,随着互联网技术的不断快速发展,网络中的数据量日益庞大,大多数是以文本的形式存在的。如何有效处理这些海量数据,从中发现......
本文的工作主要集中在基于语义的文本相似度计算技术研究上。本文根据自然语言的特点,提出了通过比较两个文本关键语义对来......
Internet的迅速发展给人们带来诸多方便的同时,也带来了诸如信息过载、信息迷向、不良信息充斥网上等等很多问题,信息过滤应运而生。......
随着互联网络的发展,Web页面的数量激增,人们需要对大量的文本资源进行有效的组织,以有利于信息检索、模式发现、为用户提供推荐服务,......
本文主要从文本预处理和文本聚类两方面较为系统的研究了中文文本聚类的全过程。首先介绍了文本聚类关键技术的基本现状,让读者对......
随着网络信息的海量增长,从海量文本中提取摘要成为自然语言处理研究的热点课题。半个多世纪以来,学者从不同角度出发,提出不同的解决......
随着网络的发展和信息化进程的加快和深入,越来越多的电子商务网站的出现成为一种新的趋势,而且随着这样的网站的规模越来越大,网站的......
命名实体关系是构建语义网络、本体和语义Web的基础,并且广泛应用于信息检索、机器翻译以及自动问答等系统中。在命名实体关系抽取......
随着Web搜索日益被人们接受和使用,关键字查询成为了查询文档和网页的最简单、最流行的信息检索技术。由于应用需求的推动,关系数......
随着互联网信息的日益增长,通用搜索引擎已经无法满足用户对于特定领域信息的查询需求。搜索引擎正在向个性化、主题化、智能化发......
网络购物凭借物品丰富多样、方便快捷、价格低廉的特点几乎融入在每个人生活的方方面面。网络购物平台的订单量日益激增,这背后需......
通过现有的地表覆盖数据及信息服务平台,用户能够获取直观的空间分布与时空变化等信息,但对于其分布特征、地域规律、变化成因、发......
如今大数据时代的每一天都会产生大量的数据,当今人们感觉最为强烈的就是社会媒体数据的爆炸增长,比如我们日常涉及的Web新闻、微......
随着嵌入式应用以及微电子技术的快速发展,无线传感器网络技术应用越来越广泛(Wireless Sensor Network,以下统称WSN),由于WSN一般......
看电影是人们日常休闲必备的重要活动,如今电影行业发展地如火如荼,电影数量也急剧增加。互联网的迅猛发展虽然给人们获取信息带来......
专家信息的挖掘对建立全国性的专家信息服务平台尤为重要。论文通过对专家所发表的论文,承担的课题等非结构化数据进行挖掘,来自动......
随着计算机技术和信息技术的不断发展,尤其是互联网技术的日新月异,使得人们能获得信息成几何级飞速增长。但是面对着这些浩如烟海而......
带拥挤距离排挤机制的非支配排序遗传算法(NSGA-Ⅱ)在多目标优化领域具有广泛的应用,NSGA-Ⅱ箕法具有个体分布不均匀以及重复个体......
针对现有的空间向量模型在进行文本表示时忽略词条的位置和词条间关系的问题,提出了一种基于相对密度的多耦合文本聚类算法。在基......
在受限领域自动应答系统(RDAQAS)中,以"知网"和领域本体库为基础,计算目标问句和问句语料库中问句的相似度,从中寻找最相近问句,最......
针对主题搜索引擎反馈信息主题相关度低的问题,提出了将遗传算法与基于内容的空间向量模型相结合的搜索策略。利用空间向量模型确定......
用户查询与文档之间语义匹配但词法不匹配现象是影响信息检索效果的重要原因之一。本文提出了一种基于本体的信息检索查询扩展方法......
为了消除自然语言对构件文本信息描述的二义性以及增强术语间的语义关系,文中采用领域本体的思想,给出了一个基于人工智能领域本体的......
针对目前蛋白质提取方法仅以单句信息为依据的不足,文中提出了以相似性为框架基于大规模文本的蛋白质交互关系识别方法。首先通过......
在软件开发过程中,开发人员会收到用户提交的大量缺陷报告.若修复缺陷报告中问题涉及到的相同源代码文件数目超过一半,则称这些缺......
较高的参保率是养老保险制度充分发挥作用的重要基础。与以往文献研究视角不同的是,本文对我国城镇职工基本养老保险参保率的影响因......
针对目前蛋白质交互关系识别主要以单句为依据、因标注数据缺乏而导致训练集规模小等不足,提出一种以关系相似性分析为框架、基于......
研究信息自动获取系统中语义集成的实现方法. 此基础上, 提出了基于词典的语义扩充和基于空间向量模型语义的算法实现.......
利用交叉分类机制共享因特网上各种语言的信息资源是知识挖掘的重要方法,本文给出了双语交叉分类的模型以及实现方法.其主要思想是......
关联性视频点播系统中的视频存在一定的关联性,用户会以极大的概率去观看与其当前观看视频相关联且相似度较大的视频。考虑到这一......
目的构造一种新的文本查重算法,改变传统的Shingling网页去重算法,提高文本的相似度计算率,提高查准率和查全率.方法改变传统的Shi......
为了能够实现对信息检索中的文本分类策略,采用了空间模型算法,做了实验文档测试,获得了各自的权重文档搜索结果,得到在检索过程中,向量......
摘 要:通过计算机实现对文本主题合理提取、组合的过程,很多学者对此有着不同的研究。通过空间向量模型、文本聚类、遗传算去等成熟......
首先,给出了主题爬虫的概念;然后介绍了主题相关度计算的两种模型:布尔模型和空间向量模型;通过对两种模型进行分析,提出了一种基于网页......
随着Internet技术的不断发展,信息孤岛、信息过载和资源迷航问题严重影响用户高效率地发现、利用互联网资源。以为学生用户推荐优秀......
定义了骨架语片的概念。用互信息量作为衡量两个词语间相关程度的参考值,借助依存关系、基本语法将满足相关度阈值的两个词组合成......
潜在语义索引(LSI)是近年发展起来的一种新的信息检索方法,本文以潜在语义索引技术为基础,从图书馆的个性化服务理念入手,介绍了图书馆......
通过对主题网络爬虫的研究,设计一个对网络中的矿山设备资源进行收集的主题网络爬虫。设计内容主要包括主题网络爬虫的各个功能模......
问答系统应该能够用准确、简洁的语言回答用户用自然语言提出的问题,其关键和核心实现技术是答案抽取。结合关键词在用户问句和返......
为了解决传统纸质版和电子版实验报告不易保存、不易管理、不易统分、内容抄袭、样式排版不统一等问题,结合实验报告管理实际流程......
随着互联网信息数量的急剧增加,文本信息过滤技术越来越受到重视。本文首先介绍了文本信息过滤技术的发展历史和研究现状,阐述了中......
介绍基于电力公司的多格式文档智能信息搜索系统的设计原理和实现过程.通过PHP调用COM组件以及Java调用jar包,将其他多种文档转换......
随着软件技术的发展以及复用概念的提出,软件复用已成为避免重复劳动,提高软件质量与开发效率的有效技术。建立一个完善、高效的构件......
随着技术手段的不断成熟,高科技产品之间的竞争日渐激烈,但是产品之间的技术特征却日渐同质化,这使得企业之间的技术优势很难转变......