舆情短文本挖掘的数学模型及其实现

来源 :数学建模及其应用 | 被引量 : 0次 | 上传用户:clhsmith001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统针对文本数据的分析,往往基于词频、词频逆文本统计量作为文本的表示特征.这类方法往往只反映了文本的部分信息,忽略了文本的内在语义特征.本文研究了中文词语衔接的概率语言模型,其基本思想在于根据文本中词语出现的先后顺序进行建模分析,该模型在短文本数据挖掘中能够很好地针对文本语义进行量化分析.主要解决两类问题:一、如何合理地将中文词转化为数字向量,并且保证中文近义词在数字空间特征上的相似性;二、如何建立恰当的向量空间,将中文文本的语义和结构特征等信息保留在向量空间中.最后结合某城市房屋管理部门留言板的实际留言文本数据,利用BP神经网络和RNN网络两种算法,实现概率语言模型的求解.与传统文本处理方法的对比说明,本文的模型方法针对短文本语义挖掘问题具有一定的优势性.
其他文献
<正>众所周知,血脂异常是心脑血管疾病的重要危险因素,尤其血胆固醇水平与动脉粥样硬化、冠心病、脑卒中及外周血管病的发病有密切关系。大量流行病学及临床研究均已证实,积
成本管理一直是企业日常经营管理的一项中心工作,在企业生产经营实践中起着相当重要的作用。传统成本管理方法是一种基于单一会计信息的价值模型,以这种模型为核心的管理已经不
建构主义提供了一种与传统的教学模式不同的学习理论。建构主义学习理论将传统的学习过程中学习者被动地接受知识变成学习者积极地建构知识,强调学习的主动性、社会性和情境
针对多体结构中连接部位带来的运动不连续问题,提出了将连接部件不作节点处理而作单元看待的设想。从力学基本原理出发推导了单元的刚度矩阵与阻尼矩阵,并由拉格朗日方程推导了
2017年,食品生产行业出现了新的局面,新修订的《食品生产许可审查通则》(以下简称《通则》)已于2016年10月1日开始施行.新《通则》的实施,对食品生产企业提出了更多、更高的要
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
会议
黄土高原是中华民族的发祥地.由于自然和人为因素的影响,使其成为水土流失最严重、生态环境问题最为严峻的地区之一.笔者阐述了黄土高原的生态现状及其自然地理特征,分析了影
随着经济的发展,水下沟槽爆破已广泛应用于经济建设的多个领域。由于水下爆破的复杂性,使得水下爆破成本很高、危害难以控制。对3m水深某过江水下沟槽爆破施工的钻孔方法、孔网
随着我国信息技术的不断发展,它在农业方面的贡献日益突出。农业生产中,传统农业在技术手段与管理模式上已明显落后。农业生产在产量、规模和管理等方面具有较强的多变性与依