文本特征相关论文
在经典网络表示学习框架上进行改进,提出了基于文本注意力机制优化的网络表示学习模型。首先学习上下文节点的平均嵌入,然后利用上......
互联网医疗平台发布的付费健康知识是专业人员分享高质量知识经验、普通用户提升健康素养的有效途径。而市场优胜劣汰的特征,使得......
为了实现对用户对酒店使用感受的情绪倾向的分析,并且针对现有的词向量模型忽略了词的上下文的关系的问题,提出了一种基于BERT-BiLST......
随着软件数量和种类的快速增长,有效地挖掘软件需求的文本特征,并对软件功能性需求的文本特征进行分类,成为软件工程领域的一大挑战。......
统编版高中语文教材必修下册第八单元人文主题是“责任与担当”,其中第二篇课文《答司马谏议书》是书信体驳论文。书信赠答,是古代士......
随着“媒介融合”成了传媒产业的发展趋势,融合新闻也成为了重要的新闻类型。H5新闻作为新兴技术与新闻报道的融合新闻类型,与传统......
数据挖掘技术的应用价值被深入挖掘,其可以实现大规模信息中的关键内容提取,有效捕捉隐含信息,掌握信息发展的基本趋势。在数据挖......
债券违约,在我国主要是针对公司信用类债券而言,是指企业对其发行的一般企业债券、公司债券和非金融企业债务融资工具无法按时偿还......
Webshell植入后门攻击是目前网络入侵的常用手段之一,有着隐蔽性高,危害性大的特点,攻击者通过混淆代码等免杀技术会绕过目前检测......
随着计算机科学的发展和教学资源的丰富,学生在校内外都会遇到含有不同文本特征的各种文本。因此,近年来,文本特征在英语阅读理解......
中国文学外译近年来在国内成为研究的重要课题。本文以“纸托邦”这一海外知名阅读平台为例,分析“纸托邦”外译文学作品的优势。......
语言使用者的语言表现往往受制于交际中的情境因素。然而,人们对情境因素如何影响语言表现还知之甚少,对情境意识与语言能力之间关......
[研究目的]高质量专利对促进专利转化、技术追踪和战略布局十分重要,面对海量专利数据,如何准确高效自动识别高质量专利,为开展后......
教师解读和使用教材应有强烈的单元意识,以体现单元的整体性和关联性.本文结合统编小学语文教材五年级上册第八单元内容,提出在单......
石油勘探领域的现场报告和科研文献等研究资料极具科研价值,将其共享至网络平台供科研人员使用,有助于提高资料利用率。随着研究资......
本文基于京剧行当文本系统性、民族性和专业性三大特征,从词汇和句子两个层面提出英译策略.词汇层面,采用音译加直译或音译加注释......
技术文本的翻译可以促进技术文档的标准化,为科技产品的开发和推广提供支持。该类型文本的翻译实用性强,对于翻译方法和技巧的探讨......
产品用户在企业建立的开放式创新平台上发布创意,认可度表示创意是否受到欢迎,是衡量创意质量的重要指标.通过创意文本传达的信号,......
在解放区戏剧研究中,翻身叙事被描述为一个历史隐喻,象征着中华民族在中国共产党的领导下逐步实现经济、政治、文化上的全面解放.......
上市公司年报中的描述性文本信息是上市公司信息披露的重要组成部分,通过对上市公司信息披露文本的挖掘与分析可以提高对其财务风......
随着深度学习方法的不断发展,跨模态哈希检索技术也取得了长足的进步.但是,目前的跨模态哈希检索方法通常基于两种假设:a)相似文本......
如今,互联网的发展日新月异,人们在日常生活中越来越离不开网络,互联网正逐渐变为人们接收和传播信息资源的主要媒介。然而,丰富的......
中文短文本分类最重要的是提取和表示短文本特征,传统的表示方法静态训练词向量,存在特征稀疏、语义不足等问题,对此提出一种基于......
文本特征是自然语言处理中的关键部分.针对目前文本特征的高维性和稀疏性问题,提出了一种基于Word2Vec词嵌入和高维生物基因选择遗......
微博用户兴趣发现对社交网络的个性化推荐和信息传播的正确引导具有重要意义,因此提出了一种基于多粒度文本特征表示的微博用户兴......
微博数据具有实时动态特性,人们通过分析微博数据可以检测现实生活中的事件。同时,微博数据的海量、短文本和丰富的社交关系等特性......
文本特征提取与表达是网络内容安全舆情分析研究的基础,本文借鉴知网的概念,结语义网络图分析方法,提出了一种文本特征提取与表达的分......
使用尽可能多的特征准确的描述文本、尽可能选择有代表性的特征才能最大程度上改善文本处理系统的性能.如果文本特征处理程序(包括......
本文提出了一种新的双语文档对齐算法,该算法用TEIDF方法进行文本特征采样和权重计算,使用统计翻译模型进行双语词汇对齐,用Dice方......
本文提出了一种以MAS为基础的Web化构件挖掘技术,介绍了构件的描述规范,讨论了相关Web文本挖掘技术,介绍了Agent,MAS概念和技术等.......
信息安全审计系统智能性研究是目前信息安全领域的研究热点,其中模式识别及数据挖掘等技术在信息安全审计上的应用得到了广泛的关注......
信息安全审计系统智能性研究是目前信息安全领域的研究热点,其中模式识别及数据挖掘等技术在信息安全审计上的应用得到了广泛的关......
答疑系统是远程教育学习支持服务的重要组成部分,将需要的信息反馈给远程学习者是答疑系统的根本目的。本文以TFIDF (term frequenc......
域外汉籍研究是学术界热门的学术研究之一,域外汉籍之价值越来越得以彰显,对于"域外汉籍"的定义,学术界认为包括三个方面:第一,......
利用WEKA平台对中文文本进行了聚类实验研究。作为国外一款优秀的开源数据挖掘软件,在国内用来做中文信息处理研究的却很少。通过调......
本文主要介绍了采用自然语言处理技术和计算机网络技术相结合的方法,针对目前存在的互联网信息污染现状,监测非法网站有害信息,搜寻非......
小说《小二黑结婚》的主题包括三个方面:破除封建迷信,争取婚姻自主,打倒封建恶势力.在山西抗日根据地的历史语境下,破除封建迷信......
双语句子相似度旨在计算不同语言句子间的语义相似程度,在信息检索、平行语料库构建、机器翻译等领域有重要作用.由于汉语、老挝语......
随着移动互联网、摄像设备、社交网络等技术的迅速普及,视频成为互联网用户之间的一种新的交流方式,用户可以随时随地发布和分享多媒......
大数据时代,万物互联的互联网+技术让信息更加共享化。电影产业作为大众娱乐项目发展迅速,影片数量逐年增加,电影信息过载现象日益加......
大学英语四、六级(以下简称“四、六级”)是我国大规模高风险的英语考试,对其进行效度研究一直是我国外语测试界关注的重要议题。然而......
传统的文本挖掘方法由于不能准确划分网络舆情关键词,导致文本挖掘时的聚类效果不佳。为此,本文提出基于大数据的网络舆情文本挖掘......