文本数据相关论文
在当今大数据时代的环境背景下,规模庞大的互联网数据信息无法得到有效的利用,“信息过载”日益加重。使用推荐系统可以有效地为用......
五年发展规划(The Five-Year Plan),也称五年发展计划,即中华人民共和国国民经济发展五年规划纲要,重点目标是对我国的主要经济社会......
财务报告舞弊是企业舞弊的手段之一,不仅会导致会计信息失真,而且会危害经济的健康发展,因此,如何克服传统的人工检测和基于数值指......
基于文本数据的混频预测模型是本文提出的新模型,是指模型中存在非结构化文本数据时,自变量之间时间统计频率一致(同频)或者时间统计......
大数据时代产生了大量的文本数据,由于数据源的不同以及产生数据过程的复杂性,造成了大量的数据具有异质结构.将几种最新的机器学......
安全永远是轨道交通运输的重要主题。轨道交通通常是指国家铁路系统、城际轨道交通和城市轨道交通。保证轨道交通运输安全需要工作......
我国的传统村落保护与发展研究主要基于以现场踏勘为基础的传统数据。近年来,伴随着网络技术、无人机航拍等技术的快速发展,大数据......
财务报告舞弊是企业舞弊的手段之一,不仅会导致会计信息失真,而且会危害经济的健康发展,因此,如何克服传统的人工检测和基于数值指标的......
已有证据表明传统的均值-方差投资组合策略在样本外评价中并不稳健,甚至其绩效还不如经典的等权重策略,这为投资组合优化带来了不小......
互联网的发展和移动客户端的普及拓宽了投资者获取信息的渠道,影响了股票市场的运行模式。行为经济学的研究让人们意识到投资者情绪......
在大数据、自然语言处理、数据挖掘等技术迅速发展的今天,如何有效地从互联网平台上积累的大量与财经领域相关的财经文本数据中,挖掘......
【目的】提出不依靠专利引文数据、利用专利文本数据评价企业技术实力的方法。【方法】该方法综合采用专利授权数量指标、专利增长......
大数据环境导致数据密集型科研范式产生,知识服务机构的服务模式也已转变为以用户为中心。在这种情况下,知识资源存在动态复杂的关......
首先从理论上研究了关联规则发现问题,通过研究发现依赖最小支持度和信任度的理论得到了经典关联规则存在的问题所在,提出通过引入......
传统加密技术在文本数据加密中得到了广泛的应用。但由于二维数字图像的特殊性,如信息量非常大、相邻像素间具有很强的相关性、不......
九十年代初期,基于内容的多媒体检索一直是计算机领域的研究热点,那时的数据量、数据种类在量级上无法与今天相比,如今的多媒体数据当......
随着网络信息技术的迅速发展和企业信息化程度的提高,有越来越多的信息积累,其中大部分是以文本形式存在。人们急需一种能够从大规模......
文本数据并不仅仅以数据形式存储在电脑中,同时通过打印和扫描以纸质形式传播,这对纸质文档内容安全构成了很大的威胁。因此,能够抗打......
互联网每天都会产生海量文本、视频、图像等信息形式,其中文本作为重要的信息载体之一占据着越来越重要的地位。文本数量的激增,导......
自九十年代产生以来,数据挖掘技术的研究已经比较深入,研究范围涉及到关联分析、分类分析、聚类分析、趋势分析等多个方面。在常见的......
本研究针对因特网上的文本数据进行语言识别,包括网页和电子邮件内容等,以构建实时、高效的语言识别模块为目标,设计了一种复合方法来......
面对浩如烟海的电子信息,如何帮助人们有效地收集和选择感兴趣的信息,如何帮助用户在日益增多的信息中发现潜在有用的知识,目前已......
文本数据常用文档-词二维共现矩阵表示,大多数传统聚类算法属于单向聚类,即要么是对样本进行聚类,要么是对特征进行聚类,没有考虑......
随着文本数据的急剧增长,文本聚类方法已成为大家关注的热点。文本数据常用文档-词矩阵表示,基于这种表示方法大多数传统的聚类算......
互联网上各种语言的文本数据在以几何级数不断增加,这些文本数据自然成为自然语言处理研究的宝贵资源。本文先从互联网上获取感兴......
随着互联网的迅速普及,它已经成为我们生活中不可或缺的一部分,在它带给我们极大便利的同时,网络安全也越来越受到人们的关注。即......
Behaviors Modeling and Analysis of Big Data from Web Apps Using Machine Learning and Deep Rnn Techni
本文提出了一种移动计算的大数据服务应用,它是一种基于上下文情境处理网络平台用户文本数据的方法,应用数据挖掘技术和深度机器学习......
当前的大多数中文分词系统都是基于词典的,但是其不能正确的切分文本中新词(字典中不包括)。这些基于词典的分词系统在处理包含较......
随着计算机通信技术和互联网技术的飞速发展,多媒体信息被人们广泛应用。正因为如此,信息安全问题凸显,特别是数字产品的版权保护......
随着互联网飞速的发展,网络信息量不断增加,为提高实时检索的效率,需要一种快速的索引方法。就搜索引擎而言,对大规模文本构建索引涉及......
倒排索引是目前应用最为广泛的全文索引技术,是现代搜索引擎的核心技术。现在互联网上文本数据呈现爆炸式增长,为这些文本数据构造......
信息数据在现代生产和生活中越来越重要。数据仓库被大型企业及政府广泛用于存储和处理大规模数据。OLAP联机分析处理成为数据仓库......
随着互联网的不断发展,网络上的文本数据日益增多,如果能对这些数据进行有效分类,那么更有利于从中挖掘出有价值的信息,因此文本数......
随着互联网技术的发展,网络信息数量不断增加。网络数据多以文本类型展现,但文本信息分布发散,内容复杂,分类单一,导致网络信息的......
随着大数据、人工智能等技术的快速发展,数据驱动下的智能化浪潮给金融业的发展带来了新的创新机遇和商业模式。目前,金融领域每天......
针对网络论坛文本数据的特点与网络论坛的结构,提出了一种网络论坛文本数据获取与存储方法。先采用Browser/Server架构云构建网络......
随着平板电脑(Tablet PC)的问世,一种具有识别手写体文字输入能力的“数字墨水”(Digital Ink)技术也随之出现。“数字墨水”技术是......
阜阳市局 £4a 局长——_MINtkMMtgj’#lnH$B——q.M——D收束志不他只邀狲位J则【科校为先导推动地租工作.B为广为戳民U用凶盼引眯B.......
“游戏”是历史最为古老的人类活动之一,游戏作为一种不可或缺的文化现象,已经被学术界纳入研究视野,从计算机理论、教育学、心理......
随着大数据时代的来临,海量信息充斥网络,面对如此复杂而庞大的数据,快速且准确地获得关键信息,变得尤为重要。在文本领域,每天都......
随着实验技术和信息技术的发展,产生了海量的人体生理功能实验数据。在积累生物数据的同时,也累积了大量的非结构化的生物医学文献......
随着信息技术在企业生产、经营、管理等环节的渗透不断加深,“数据”资源在企业中的地位愈加重要.各信息系统中除结构化数据之外还......
铁路道岔是铁路基础设施中非常重要的设备,也是最容易出现故障的信号设备,其状态会直接影响整个铁路系统的可用性和服务质量。其一......