文档相似度相关硕士博士期刊学术论文

文档相似度相关论文

跨语言文档对齐

本文提出了一种新的双语文档对齐算法,该算法用TEIDF方法进行文本特征采样和权重计算,使用统计翻译模型进行双语词汇对齐,用Dice方......

会议

跨语言文档对齐文档相似度文本特征语言书写

文档图像检索技术研究

文档图像检索是图像检索研究领域的重要课题之一,也是近年来备受世界各国研究者关注的前沿方向.文档图像检索算法可以归为基于字符......

会议

文档图像检索光学字符识别文档相似度关键词识别自动生成摘要

XCC:一种基于聚类的XML文档压缩存储方法

XML文档压缩处理是XML数据管理研究领域的一个热点问题,已有的研究工作均以XML文档为基本处理单元,而没有考虑因文档间存在相似性......

会议

XML数据管理数据压缩聚类文档相似度文档压缩存储

通过自聚类的软件说明文档来挖掘标注SAAS服务的标签

基于SAAS的在线服务数量曰益宠大，使得如何有效的查找特定的服务成为突出问题。目前普遍采用用户自定义的服务标签来标识服务，并通过......

会议

服务标签分词文档相似度软件网络

智能文档的相关问题研究及应用

该文以计算文档之间的相关性为目标,先后展开了汉语分词、特征选择、自动分类以及向量空间模型计算相似度四个步骤的工作.汉语分词......

学位

贝叶斯网络自动分类特征聚类向量空间模型文档相似度汉语分词智能文档管理系统

基于语义分析的作者分类研究

作者分类是按照作者的写作风格将作品分类的过程。作者分类是文本分类的一种。风格特征集合的选择是作者分类的关键问题。本文......

学位

作者分类语义分析文档相似度计算机技术

基于词频序向量模型的快速中文文本聚类

随着信息产业特别是互联网的高速发展，人们可以很容易得从互联网、数字图书馆以及公司内部网络获得海量的数据。这些数据按照其组织......

学位

文档向量模型中文文本聚类特征提取词汇过滤文档相似度词频序向量模型

信息检索中结构化文档相关度计算方法的研究

随着社会信息化进程的不断发展，人类对信息的需求和依赖程度越来越高，如何从海量信息资源中快速有效的获取有用信息，已经成为人们研究......

学位

信息检索文档相似度结构相关度

基于加权层次子树的XML文档相似度计算

近几年来，随着社会信息化进程的不断深入发展，人类对信息的需求和依赖程度越来越高，如何从海量的信息资源中快速有效的获取有用的信息......

学位

XML文档加权层次子树模型文档相似度聚类分析树编辑距离模型

基于加权层次子树模型的XML文档相似度的计算

XML因其具有的半结构化、可扩展性和自描述性等特点,在互联网中得到广泛应用.海量的XML文档也带来数据搜索的困难.本文基于加权层......

期刊

XML文档加权层次子树模型文档相似度计算

基于上下文语义理解的检索系统

随着互联网的高速发展,搜索引擎为用户获取各种信息提供方便,但随着数据量、信息量的大幅增长,存在着信息过载的问题,用户如何从海......

学位

信息检索指针网络文档相似度

基于加权层次结构的XML文档相似度算法

提出了一种基于加权层次结构的XML文档相似度算法.根据XML文档的层次结构信息,该算法能够快速的进行文档相似度的计算,并识别出具......

会议

加权层次结构 XML文档文档相似度相似度算法问题的复杂度普遍适用性相同结构结构信息变换检测实验识别聚类计算抽取

相关反馈任务中一种基于文档相似度的检索结果重排序方法

研究界关于相关反馈问题的研究已经有近30年的历史，相关反馈也被证明可以在很大程度上稳定地提升检索系统的性能。由于目前相关反馈......

会议

相关反馈任务文档相似度检索结果反馈信息检索系统搜索结果排序方法扩展方法检索性能反馈问题数据表证明实验经典查询

一种基于语义信息计算XML文档相似度的新方法

本文提出了一种根据两段XML文档标记的语义信息计算相似程度的方法，设计并实现了计算两段XML文档相似程度的实验系统，实验结果表明该......

会议

语义信息计算文档相似度相似程度文档标记实验系统方法设计

XML文档集的聚类研究

本文提出了充分利用XML的结构信息与链接信息的文档结构链接向量模型SLVM,并以K-means聚类方法为例,具体讨论了利用SLVM模型,计算......

会议

文档集文档相似度向量模型文档结构链接信息聚类中心聚类方法结构信息算法计算

基于WAF的文档聚类技术研究

聚类是一个重要的基于统计的无监督信息处理工具,在很多应用领域起着基础的作用。其中,文档聚类是对文本文档进行聚类的方法,对于......

学位

WAF 文档聚类文档相似度平滑

基于文本和公式的科技文档相似度计算

本文通过对荣华二采区10...

期刊

公式相似度文档相似度覆盖度科技文档

通过自聚类的软件说明文档来挖掘标注SaaS服务的标签

基于SaaS的在线服务数量日益宠大,使得如何有效的查找特定的服务成为突出问题.目前普遍采用用户自定义的服务标签来标识服务,并通......

期刊

服务标签特征词文档相似度软件网络社区发现 software service tag feature words document similarity

基于双向路径约束模型的XML文档结构相似性度量

为了弥补树编辑距离方法时间复杂度高和频繁路径方法丢失过多语义信息的不足,建立XML文档的双向路径约束模型,从而更全面地提取XML......

期刊

XML 文档相似度双向路径约束模型 N-Gram

融合主题模型及双语词向量的汉缅双语可比文档获取方法

缅甸语属于资源稀缺型语言,汉缅双语可比文档是获取平行句对的重要数据资源。该文提出了一种融合主题模型及双语词向量的汉缅双语......

期刊

主题模型双语词向量文档相似度汉语—缅甸语双语可比文档 topic model bilingual word embedding document sim

基于词共现的文档表示模型

文档表示模型是文本自动处理的基础,是将非结构化的文本数据转化为结构化数据的有效手段。然而,目前通用的空间向量模型（Vector Spa......

期刊

文档建模词共现文档相似度文本挖掘 document model co-occurrence document similarity text min

生物信息学电子文档收编及优化检索的实现

生物信息学涉及生物、化学、物理、数学、计算机和互联网应用等多方面知识,要从事这个领域的研究工作,必须掌握更多的各方面知识.......

期刊

生物信息学电子文档都柏林核心 XML 文档相似度检索 bioinformatics electric document XML document s

基于词间语义相关度的搜索结果聚类算法

将查询结果根据内容进行聚类是提高搜索引擎服务质量的关键技术之一.搜索结果聚类时只能从文档标题和文档片段中抽取有限信息,传统......

期刊

搜索结果聚类词间语义相关度文档相似度 search result clustering semantic relevance between words

基于词条之间关联关系的文档聚类

针对现有的空间向量模型在进行文档表示时忽略词条之间的语义关系的不足,提出了一种新的基于关联规则的文档向量表示方法。在广义......

期刊

文档聚类关联关系词条同现文档相似度潜在语义 document clustering association terms co-occurrence

基于术语同义关系的文档相似度研究

基于向量空间的文档相似度算法假设特征元素间关系为正交,当2篇文档采用了具有相近语义的不同术语描述时,该方法不能准确反映二者......

期刊

同义词词语相似度文档相似度 synonymous similarity between two terms similarity between two d

基于Q/A与文档库的智能课程答疑系统

评价智能答疑系统优劣的重要指标是准确率和召回率。系统结合Q/A库和文档库搜索技术的优势实现,利用成熟的Q/A技术回答常见问题,保......

期刊

智能答疑召回率向量空间模型文档预处理文档相似度 intellectualized answering recalling vector space

基于主题词匹配频数的搜索引擎结果聚类算法

搜索引擎结果聚类对提高搜索引擎服务质量和智能化水平有较高的应用价值,它是从标题和文档片段的有限信息中寻找文档相关度进行聚......

期刊

搜索结果聚类词间语义相关度文档相似度主题词 search results clustering semantic relevance between w

基于词汇图的搜索结果聚类算法

将查询结果根据其内容进行聚类是提高搜索引擎服务质量的关键技术之一.搜索结果聚类时只能从文档标题和文档片段中抽取有限信息,传......

期刊

搜索结果聚类词汇图同义词文档相似度

采用相关反馈和文档相似度的维吾尔语检索词加权方法

针对维吾尔语Web文档的有效检索问题,提出一种基于相关反馈和文档相似度的检索词加权方法.首先,对维吾尔语文档进行预处理,获得相......

期刊

维吾尔语文档检索检索词加权相关反馈文档相似度 Uygur document retrieval weighted retrieval words rel

基于文档关系的信息检索模型扩展研究

随着互联网的飞速发展,网络信息呈爆发式增长,如何从海量信息中快速获取有效信息成为目前亟需解决的问题,信息检索技术是解决该问......

学位

信息检索文档关系信念网络检索模型向量空间模型文档相似度

概念与文档的语义相似度计算

将本体作为背景知识引入到概念之间相似度和文档之间相似度的计算中。通过图模型表示本体中概念以及概念之间的语义关系，用来将一个......

期刊

概念相似度文档相似度本体文档聚类 concept similaritydocument similarityontologydocuments clust

基于文档关系改进的向量空间模型

由于用户查询信息不足而导致传统向量空间模型检索结果不够准确,针对此问题,提出了一种基于文档关系改进的向量空间模型.改进模型......

期刊

文档关系向量空间模型文档相似度信息检索 document relationshipvector space modeldocument similarit

基于文档相似度的双语文档排序学习

论文提出了一种双语文档排序学习模型.排序是信息检索系统中重要的一个环节,学者们已经对单语言环境下的文档排序学习问题进行了很......

期刊

排序学习信息检索文档相似度查询翻译双语语境 learning to rankinformation retrievaldocument similari

基于领域本体的智能检索模型

在传统检索模型的基础上,结合本体概念,提出一种基于领域本体的检索模型。该模型利用本体中语义概念关系及语义扩展机制对查询关键......

期刊

信息检索本体概念树智能检索文档相似度 information retrieval Ontology concept tree intelligent r

一种潜在文档相似模型

提出一种潜在文档相似模型（LDSM），把每对文档看作一个二分图，把文档的潜在主题看作二分图的顶点，用主题问的加权相似度为相应边赋权值，并......

期刊

主题文档相似度文档检索信息检索 topic document similarity document retrieval information retr

一种基于词共现的文档聚类算法

为解决文本主题表达存在的信息缺失问题,提出一种基于词共现的文档聚类算法。利用文档集上的频繁共现词建立文档主题向量表示模型,......

期刊

文档聚类文档模型词共现文档相似度聚类增益 document clustering document model word co-occurrence d

面向法律案例检索的文档相似度计算研究

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们......

学位

文档相似度二部图孪生网络注意力机制

信息检索中信息需求域的研究

信息检索作为信息获取的手段,是信息处理的重要内容,是当前信息处理研究领域中的研究热点。信息检索主要包括三个方面的内容：信息需......

学位

信息检索信息需求域下界上界文档相似度

探究计算机程序抄袭检测系统设计及应用

一、引言计算机程序抄袭检测系统是一款能够避免学术抄袭、造假等情况的计算机软件.虽然很多计算机程序被研发出来,但也出现了很多......

期刊

抄袭检测系统相似度匹配文档相似度

基于电子作业挖掘的学生学习预警模型研究

混合式教学的普及使得电子作业成为一种评价学生学习效果的重要数据来源,利用机器学习对电子作业进行建模是对学生学习预警的一种......

期刊

文档向量 k-means聚类轮廓系数文档相似度图论效率

基于文本和公式的科技文档相似度计算研究

常用的文档相似度计算方法主要包括集合模型方法、向量空间模型方法、潜在语义分析法等,这些方法仅利用文本信息计算文档相似度。......

学位

科技文档文档相似度公式相似度特征序列化有效匹配子树文档间公式

基于关键词提取的娱乐新闻文档去重算法

去除内容相同或相近的新闻是提高搜索引擎的关键技术之一。提出一种基于关键词提取的新闻去重算法,通过以标题为种子点构建词汇链......

期刊

关键词提取新词识别文档相似度

基于MapReduce架构的文档相似度计算方法

MapReduce是Google开发的在超大集群下进行海量数据运算的一种分布式编程模式。Google利用MapReduce编程模式,其搜索业务取得了巨......

期刊

TF-IDF 文档相似度海量数据 MapReduce

基于概念网络的短文本分类方法

针对档案领域的短文本分类,设计一种基于概念网络的自动分类方法。通过分析领域内短文本的语言特点构建领域本体,利用自然语言处理......

期刊

短文本分类概念网络文档相似度领域本体

文本语义相似度计算方法研究

随着计算机和互联网技术的发展,文本数据的数量大幅度地增长,但是这类数据对于计算机来说难于理解和使用,解决这一问题的途径之一......

学位

概念相似度句子相似度文档相似度语义相似度计算

基于MapReduce的KNN分类算法的研究与实现

随着互联网行业的快速发展、信息量增加,如何处理海量数据成为行业面临的一个严峻考验。一种处理海量数据的方法是对文档进行分类,......

学位

文本分类 KNN算法文档相似度 MapReduce架构集群

电子作业管理和作业抄袭检测技术研究

作业环节是整个教学过程中的一个重要的环节，作业环节信息化是教育信息化中重要的组成部分。作业环节的工作质量、效率和效益直接影......

学位

电子作业管理文档复制检测文档预处理文档相似度

基于中文分词及知识本体技术的课程智能问答系统的研究

随着网络信息技术的发展,网络远程辅助教学逐渐成为人们进行学习的一种有效方式。由于网络教学本身的一些制约,问答系统成为它的有......

学位

课程知识本体中文分词智能问答文档相似度

跨语言相似文档检索

检索一篇文档在其他语言中的译文对于双语平行语料库的建立是一件很有意义的工作。本文提出一种改进的跨语言相似文档检索算法,该......

期刊

计算机应用中文信息处理跨语言相似文档检索文档相似度双语文档对齐

基于语义分析的作者身份识别方法研究

作者身份识别是一项应用广泛的研究,身份识别的关键问题是从作品中提取出代表语体风格的识别特征,并根据这些风格特征,评估作品与......

期刊

计算机应用中文信息处理身份识别语义分析文档相似度

看过本文同时还关注