基于神经网络中文短文本作者识别研究

来源 :中国人民公安大学学报:自然科学版 | 被引量 : 0次 | 上传用户:coolyl1979
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网应用的日益普及,短文本作为电子数据证据在法庭科学中日益重要,法院亟需对大量网络聊天内容作者归属进行同一认定。传统机器学习方法对特征选取非常敏感,因为在实践中较难提取到准确的作者写作习惯特征,所以影响了传统机器学习方法的实践效果。针对文本短、特征少、特征提取困难的缺点,提出了融合多属性的神经网络中文短文本作者识别方法。首先将文本的结构特征、语义特征、发送时间、发送位置、发送频率等属性融合进文本序列,对文本序列进行词向量化表示,采用卷积层和Bi-LSTM层自动提取局部特征和上下文关系特征,通过注意力
其他文献
区块链具有不可被篡改和去中心化的特性,将其应用到存储系统中,有助于提高存储系统的数据安全性和系统可扩展性。区块链技术与存储技术的融合主要分为3方面:基于区块链构建的
随着我国社会经济及科技水平的迅速发展,带动了会计行业的稳定前进,当前时代在为会计工作带来发展机遇的同时,也带来了一定的挑战,使得会计行业的竞争日趋激烈,所以会计单位
紫秋葡萄,别名高山刺葡萄,原产湖南省怀化市芷江县木叶溪乡和大树坳乡一带高山上,为当地特色优良葡萄品种。此品种适应性好,抗逆性强,易栽培,产量高,鲜食口感好。目前,在怀化市中方县
本文从在科普知识学习中培养学生良好行为习惯、在科技实践活动中培育学生创新精神品格、在小组合作探究中培养学生团队合作精神、在社会考察调查中增强学生社会责任意识、在
本文作者在饰演琼剧《汉文皇后》窦广平角色中,通过认真听取导演说戏、研读剧本、揣摩角色心理、性格特征,不但生动、准确、鲜明地展现了角色的舞台形象,还创造性地设计画龙
为了满足高性能计算平台对软件定义互联的通信需求,设计了一种支持多种通信协议规范,且支持异构协议互联的软件定义多协议控制器架构。通过嵌入可编程硬件电路实现Fiber Chan
为了进一步提升交通事故预防的针对性和科学性,统计分析了深圳市道路交通事故的时空特征、类型特征、肇事人员、车辆特征和事故原因特征等,表明深圳市各区的道路交通事故与社