Doc2Vec相关论文
人工智能技术近年来有了跳跃式的发展,其理论和实践应用甚至覆盖到了司法领域。法律智能作为一种司法辅助工具,有利于提高司法效率......
由于互联网时代的发展和移动端用户人群的崛起,网络招聘也因其流程简单、快捷高效等特征成为应聘者和企业沟通的主要渠道,从综合性......
针对文本聚类时文本特征维度高,忽略文档词排列顺序和语义等问题,本文提出了一种基于句向量(Doc2vec)和卷积神经网络(Convolutional Neu......
在大数据时代,信息呈现爆炸增长状态,信息的飞速增长给当今信息化社会带来了很大的挑战。如何准确分辨出所需要的信息数据以及如何......
随着电子商务的发展,人们迈入了信息过载的时代。面对日趋严重的过载数据现象,推荐方法是一个很好的解决方案。它通过收集用户历史......
当前用户在互联网中发布的一些文本信息中包含色情、暴力、政治敏感或恶意广告等不良信息,对网络生态环境造成破坏,特别对广大青少......
主题模型能够挖掘文本中潜在的语义信息,实现对文本内容更好的表征。对专利文本进行主题提取,有利于专利分析人员更好地了解某领域......
摘要:技术预见是支持政府制定产业政策、企业进行战略布局的重要手段。当前广泛采用的技术预见方式是基于专家经验的定性方式,易受到......
摘 要:针对文本、语义、关键词等方法计算主观题相似度的不足,提出一种基于相似度组合的方式构建主观题评分模型。该模型可根据评分......
交通运输业是中国改革开放进程中的支柱性产业,而民航业更是实现交通强国的重要战略产业。安全作为任何一个行业都必须直面的主题,......
文档表示是自然语言处理领域中的一项重要工作,目前主要的一种研究方法是基于文档的上下文语义对其进行分布式表示。其中doc2vec是......
在学校及企业的考试中,中文主观题是必不可少的考试类型。目前对中文主观题的批改仍采用人工方式,这种方式不仅时间耗量大、工作量......
作为解决信息过载问题的有效工具,推荐系统已经成为电子商务网站和社交网络平台的基本组成部分。根据推荐系统依赖的数据类型,可将......
在多数企业拥有庞大的知识数量和优质的知识资源的情况下,如何利用推送系统将知识主动的推送给设计人员以提高企业生产效率是目前......
随着知识爆炸性增长和学科体系日益复杂,如何有效地从海量文献中挖掘学科主题以及分析其演化模式成为一个值得深入探究的研究课题......
智能问答系统结合了自然语言处理技术和信息检索技术,能用准确、简洁的自然语言回答用户用自然语言提出的问题,问答系统根据其应用......
[目的]随着“互联网+电子政务”的发展,国家越来越重视我国电子信息化建设,对于政府相关决策者、管理者、信息化工作者及研究人员......
为了提升文本取证过程的智能化和便利性,提出一种基于Doc2Vec和改进K-means聚类算法的文本取证方法.首先提取并转化待取证计算机中......
[目的/意义]区块链作为一种新兴的数据共享技术,对推动产业变革、改变社会治理模式具有重要意义。当前对区块链研究现状的分析多侧......
在文本分类的过程中,由于文本数据具有非结构化、高维性、稀疏性的特征,常常会导致分类效果的不理想.由此可知,文本分类的准确性十......
人工智能在近几年快速发展并成为最热门的技术之一,如能快速了解人工智能技术热点与发展态势,对抢抓人工智能发展的重大战略机遇与......
自动化、高效率和细粒度是恶意软件检测与分类领域目前面临的主要挑战.随着深度学习在图像处理、语音识别和自然语言处理等领域的......
摘 要:受中美贸易摩擦不断升级、国内经济结构调整和金融市场波动等环境压力影响,目前全国就业形势整体较为严峻。互联网中海量岗位......
近年来,IT技术催生电子商务繁荣发展,网络交易深度融入到了人们的生产生活中。网络交易论坛作为重要的交易载体,其多样化和差异化......
针对短文本矢量化数据稀疏和维度高,基于词频统计语义缺失,传统聚类方法对非球面类别检测困难以及计算量大等问题,提出一种聚类新......
传统的用户属性推断方法主要基于机器学习及统计学习,其推断方法忽略了用户的整体表征及任务之间的相关性。本文提出一种基于多任务......
标签构建对信息检索和个性化推荐有重要的辅助作用,学者的研究兴趣标签体现了一定时期内学者和某一个领域的研究热点与发展方向。......
随着公安信息化建设的发展,警务工作中收集了大量公共安全数据,而其中的新闻信息作为国家和公安机关了解社会动态和社会信息的重要......
论文基于评论文本语料信息提出Word2vec模型与Doc2vec模型与机器学习相结合比较的评论文本情感分析模型,经过实验的对比验证,结果......
检测恶意URL对防御网络攻击有着重要意义.针对有监督学习需要大量有标签样本这一问题,本文采用半监督学习方式训练恶意URL检测模型......
随着互联网技术突飞猛进的发展和社会日新月异的进步,手机通信已经成为人们生活中不可或缺的一部分。与此同时,中国传统的三大运营......
随着互联网时代的发展,人们在生活中会使用到很多软件产品。各种网站的用户量都有了较大的增长,人们在使用过程中产生了庞大的web......
伴随数据时代的来临,社会的快速发展和科技的迅猛进步给传统招聘带来了巨大的变革,如今的工作招聘更多地体现出规范化、系统化和网......
近年来,随着大数据发展热潮兴起,电信运营商能获得的DPI数据规模越来越大。如何对如此海量的DPI数据进行实时的挖掘和分类是运营商......
战场态势智能推送中的推荐算法是最核心、最关键的组成部分,在很大程度上决定了战场态势推送性能的优劣。深度神经网络推荐算法对......
基于电子病历的疾病预测一般是根据病人的症状预测疾病,而很少研究疾病之间的时间顺序关系。引入一种新的电子病历表示法,该表示法......
[目的/意义]针对技术融合趋势研究缺乏将技术与功能结合的有效方法体系,导致技术融合目标导向性不强、研究结论可实践性弱、预测存......
大数据时代必然会导致"信息过载(information overload)"现象,企业如何在海量的用户行为数据中准确判断用户属性,是精准营销等领域值得......
为了可以在准确地判别中文文本的情感倾向的同时,降低训练成本、提高效率,提出了基于Doc2vec和深度神经网络的方法对中文文本进行......
随着互联网的快速发展,人们越来越倾向于在网络上表达自己的情感和态度。微博、论坛、贴吧、手机新闻等网络新媒体也应运而生。人......
在农业科研办公过程中,科研人员进行信息检索的频率高,信息需求精度高,但传统的综合性搜索引擎检索农业实用技术、政策法规、专题......
为了提高文本相似度检测算法的准确度,提出一种结合潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)与Doc2Vec模型的文本相似......
【目的】引入深度神经网络模型Doc2Vec,以综合考察文本的上下文语境信息。结合改进的K-means聚类算法,实现中文单文档摘要的提取。......
协同过滤推荐方法由于只利用用户对项目的评分数据,常常会遭遇到评分数据稀疏问题和项目的冷启动问题。本文提出了一种利用项目文......
[目的/意义]使用深度学习中Doc2vec文本向量化的方法进行专利与行业间类目相似度的计算,旨在为用计算机进行类目映射时提供新的方......
针对当前政务系统中人工审批文本效率低下的问题,本文将文本相似度引入电子政务中。当前基于文本相似度的网络模型中,存在着生成的......
目前专利侵权纠纷案件时有发生,企业一旦卷入专利侵权纠纷,通常会面临时间考验和经济损失.本文选取中文专利数据样本,抽取专利权利......