VSM相关论文
食品工业是埃塞俄比亚的主要问题,往往达不到预期目标,需要更多的工作才能更好地利用。以埃塞俄比亚食品工业为例,改善目前的状况......
汽车零部件行业一直是先进管理方法和新技术应用的典型行业。如何理顺业务流程,利用新技术的导入解决生产中的瓶颈问题是企业研究......
如今,在生产过程中,原材料缺陷已成为制造服装的一个问题,制造无缺陷的服装是不可能的。许多制造商尝试通过利用额外的人力并使用......
近年来,VSM、CJM等沉井施工装备采用了井壁提控下沉方法,极大地提升了沉井施工的质量和效率。本文以此为背景对圆形沉井井壁提控下......
随着Internet应用的逐渐普及,WWW已经发展成为一个巨大的分布式信息空间,为用户提供了一个极具价值的信息源。但因Internet所固有的......
随着Internet的迅速发展,网络信息不断膨胀.为了提供高效、准确的信息服务,我们需要对网络中纷繁复杂的信息进行合理的组织与分类.......
随着Internet应用的逐渐普及和发展,因特网上的信息资源正在呈几何级数增长。它给人们带来极丰富信息的同时也向人们提出了一个重要......
随着信息化的高速发展,世界变成了信息的海洋,如何从大量信息中迅速有效地提取所需信息成为急待解决的问题。由于分类可以在较大的程......
随着Internet的发展,各种信息飞速增长,人们对信息的反应速度远远低于信息的传播速度,大量无关的冗余的信息严重干扰了受众对相关......
随着互联网的快速发展和普及,人们越来越依赖于网络获取信息。作为海量的信息来源,Web可以看成是一个巨大的数据库,包含着各种各样......
目前,在中文信息处理领域中,对字和词的研究已经趋于成熟,相应的研究成果得到了广泛地应用。复句在汉语句法中具有相当重要的地位,......
随着我国城镇化的加速发展,城镇基础设施建设带来了巨大的刚性需求,对此关于城市浅层地下异常体的勘察任务也逐渐加重,但由于浅层......
向量空间模型(VSM)是文本信息处理的经典模型,它把文本用向量表示,以特征项的权值作为分量,这个架构很大程度上提高了信息处理的性能......
In this paper, we discuss several issues related to automated classification of web pages, especially text classificatio......
国际电工委员会磁合金与磁钢分委员会(IEC TC68)于近期举行了振动样品磁强计磁性测量国际比对,比对针对永磁铁氧体球和磁性薄膜两......
互联网的迅速普及,给社会生活带来巨大进步,也带来了一系列的安全问题,诸如反动、色情等不良信息得以广泛传播,极大地危害了人们正......
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生......
文献的向量表示方法对文献聚合、聚类和分类等研究是重要的。本文在向量空间模型(VSM)的基础上,通过补充文献特征此间的潜在语义相关......
1.引言 如今,随着Internet的飞速发展,数以万计Web应用走进人们的日常生活,网络中信息类型日渐庞杂。为了从海量Web信息中获取知识......
论文通过分析传统向量空间模型(VSM)的信息检索模式和讨论基于特征项-文本矩阵的特征项赋权因子(TF-IDE)的赋值问题,提出以潜在语......
本文提出一种基于Shannon信息熵的向量空间模型 (VSM )中的词权重算法。同时结合词与文献的相关权重的经典计算方法IDF(InverseDoc......
This paper discusses the importance of the classification of short message, and details some key technologies related. T......
VMS应用的迅速增加使原有的以静态标志为主的交通标志系统发生了变化。VMS设置的随意性不仅使其发挥不到应有的功能,更影响了静态标......
A syntactic and structural matching mechanism for service discovery was put forward, which tries to exploit the underlyi......
基于语境和语义的聚类算法,一方面从领域、情景、背景三方面提取特征词,建立语境框架文本特征,另一方面计IDF权重值,形成关键词VSM......
TFIDF 公式是向量空间模型中应用比较成功的计算特征项权值的方法。研究发现,该公式忽略了特征项在文本集的分布比例和离散程度这......
通过研究中文问答系统的理论,进而分析当前计算语句相似度的方法,比较各种计算语句相似度方法的适用场合以及它们的优势与不足,对......
在高铁的安全运营中,高铁基础设施扮演着至关重要的角色,针对高铁基础设施养护维修管理体系结构组成的研究具有重要的实践意义。本......
发展装配式住宅,推动精益建造是促进建筑业现代化的有效途径。文章以装配式住宅项目为例介绍了精益施工的具体实践,重点介绍了价值......
传统的TF-IDF(Term Frequency&Inverse Documentation Frequency)算法提取的关键词不能合理地代表某疾病的症状,降低智能诊断系统......
主题爬虫主要用于解决用户的定制化搜索需求,即在日益增长的网络数据中快速、有效、准确地选取用户关注的主题内容进行爬取。提高爬......
采用经典的向量空间模型对网页文本进行分类。由于传统特征项权重计算公式TFIDF在网页关键词计算和关键词类间区分度不高等问题的......
本文介绍了智能化管控系统VSM对江苏台超高清电视转播平台的统一控制和管理,该系统拥有两个独立的导演区,可同时或独立进行4K和HD......
对给定的网页,提取其特征向量,计算网页特征向量与分类特征向量的相似度,使用K-means聚类方法寻找归属类得到动态阈值,提出了一种......
基于内容的过滤电子商务 recommen-der 系统在这篇论文充分被讨论。用户“唯一的特征能第一借助于向量空间模型被探索。产品信息的......
微博已经成为广大用户发布和获取信息的重要渠道之一,微博平台上集聚着大量的用户群体和文本信息资源,如何从大量的微博信息中准确......
本文对网页主题相关性算法进行研究,并在传统向量空间模型的基础上,根据网页结构特征和概念间层次关系,对网页特征项选取和权值进行优......
文章介绍了向量空间模型的基本原理分析了文本检索系统常用的性能评估标准。基于向量空间模型、自动术语提取、相关性排序等技术实......
在一些多变化的制作环境,如转播车、演播室群等,常因要配合节目需求(例如体育类、大型演出类、赛车类),而要对各工位的监看、监听、操作......
本文介绍了在向量空间模型下,使用Cosine-Measure和OKAPI—Measure两种不同的相似度评测方法,来评测查询与文本之间的相关性。通过针......
首先,选择合适的文本集合,并且对文本进行分词处理,然后,进行文档内部特征词的提取,通过采用词频统计的方法对文本向量进行降维处......
随着Internet的迅速发展,其信息容量呈爆炸性增长,但信息的庞杂无序也给人们更好地利用信息带来了困难。为此,提出了一种基于本体的农......
向量空间模型常被用于计算两个句子的相似度,通过将两个句子转换为词项向量,然后计算两个向量的夹角余弦值,就可以得出两个句子的相似......
在对中文问答系统的理论进行研究的基础上,深入分析了目前语句相似度计算的方法,研究了各种语句相似度计算方法的优缺点及其适用场合......
在文本检索过程中,排序算法一定程度上影响到搜索引擎的质量。论文首先分析了Lucene组织结构,包括建立索引,检索索引文件以及结果集排......
网络爬虫作为搜索引擎重要的组成部分,其抓取网页资源主题相关性的高低直接决定爬虫性能的好坏。文章在VSM模型的基础上引入关键词......