文本表示模型相关论文
随着科学技术的发展,研究人员发表了数以百万的学术性文献。在进行科研活动的过程中,人们需要花费大量的时间和精力进行文献调研以......
文本数据大多数是非结构化数据,如何有效处理和准确表达文本的原始信息在文本分类任务中是首要前提,从非结构转化为结构化数据的过......
本文研究内容基于国家自然科学基金项目“项目管理中项目关联分析与立项决策支持系统研究”,项目的相关性分析依据项目建议书的研究......
随着互联网的蓬勃发展,网络上每天都会产生海量的数据,仅门户网站的新闻信息更新量就非常可观。如何从这些信息中提取中关注度最大......
随着计算机和网络技术的发展,可用的信息数量在不断增长。为了能够快速准确地获取信息,研究者们开发了很多有效的算法。这些算法主要......
网络传销是一种基于互联网传播平台的新型传销形式,具有隐蔽性强、欺骗性强、涉案范围广、传播速度快等特点。网络传销扰乱了互联......
文本是一种非结构化数据,计算机无法直接对文本进行处理,需要将其转化为结构化数据.构建文本表示模型是文本处理的首要目标.本文提......
相对于文本内容,图像内容能更加一目了然将信息呈现出来,因而在阅读中呈现出二者相结合的趋势。以功能神经影像文献为例,文献中图......
学位
本文主要对基于语言网络的文本表示模型的组成、构建方法进行分析和归纳,总结模型特点和当前的主要的应用情况。......
文本信息处理正朝着语义的方向发展,而当今主流的文本表示模型——向量空间模型(VSM)以单个词语作为特征项,这忽略了自然语言中词语之......
传统的KNN文本算法在计算文本之间的相似度时,只是做简单的概念匹配,没有考虑到训练集与测试集文本中词项携带的语义信息,因此在利用K......
该文提出面向文本聚类分析的实体—动作关联模型EARM,探讨汉语语义实体及其行为的描述方法。汉语属于非形态语言,语句没有时态及语......
最近几年,越来越多学者意识到单靠数据驱动的无监督聚类方法很难满足用户对富含语义信息的文本数据的处理需求。领域知识,如领域本体......
传统的文本聚类方法大部分采用基于词的文本表示模型,这种模型只考虑单个词的重要度而忽略了词与词之间的语义关系.同时,传统文本......
为解决军事训练文档间语义相关问题,提出一种基于军事训练本体的向量空间模型构建方法。介绍了基于军事训练本体构建文档索引和基......
网页实时分类是聚焦爬虫需要解决的重要问题,现有主题特征提取方法多数是面向离线分类的,性能达不到应用要求。本文首先扩展了标签树......
随着Web3.0时代的到来,互联网中Web页面的数量和复杂性呈现出爆炸性增长趋势,伴随的是包含在Web页面中的信息也呈几何数量级增长。......
结合词项关联关系和粒子群优化(PSO)算法的特点,提出一种基于离散PSO(DPSO)的微博热点话题发现算法。通过对词语互信息及内外关联词信......
传统文本表示模型多为稀疏矩阵,文本规模的增长导致维度灾难。文中提出一种结合神经网络的文本降维方法,利用随机映射、非负矩阵分......
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清......
长期以来,自然语言处理NLP(Natural Language Processing)都是人工智能领域的一大热点和难点,其研究内容包括:文本分类、机器翻译......
自动文本分类是一种管理和利用海量文本数字信息的有效手段。尽管文本分类技术已经取得了长足的发展,但由于文本分类具有高维性、高......