【摘 要】
:
随着互联网的快速发展,互联网已经成为当今信息传播的主要渠道,人们在知乎、微博、今日头条等留下了大量的有感情色彩和情感倾向性的评论信息,如果能从这些评论数据中提取出
论文部分内容阅读
随着互联网的快速发展,互联网已经成为当今信息传播的主要渠道,人们在知乎、微博、今日头条等留下了大量的有感情色彩和情感倾向性的评论信息,如果能从这些评论数据中提取出对应的情感信息和情感倾向性,将会推动用户决策、舆情监控和信息预测等领域的发展,在科学研究以及实际应用中具有很大的价值。传统的用于解决文本情感分析的方法有基于语料库的方法、基于图模型的方法和基于机器学习的方法,这些方法都依赖于人工构造特征。但随着数据量的急速增长和表达方式的丰富,基于人工特征的模型已经难于满足新的场景,亟待提出新的方法。深度学习在模型设计、训练算法和计算性能等方面都提出了较大的改进,使得深度学习在图像识别和文本分类等领域取得较大的突破。为此,本文基于深度学习方法研究文本情感分析具体研究工作及贡献包括:1.分析了基于BI-LSTM-CRF模型的情感词提取方法,提出了针对BI-LSTM-CRF模型的改进方法,通过输入序列和激活函数的优化,提高了模型的表示能力和泛化能力;2.分析了集成学习方法,设计了基于Stacking方法的集成学习框架,有效避免了大规模构建人工特征的问题,同时提升了模型的效率;3.以舆情趋势预测问题为背景,设计并实现了舆情趋势预测系统。
其他文献
本文在观测量等权的前提下,导出了利用激光测月技术测定月球物理天平动时月面后向反射器的最佳分布,并定量分析了利用现有反射器测定月球物理天平动时的权重。
汉字文化,拥有着博大精深的历史文化造诣,但却不仅仅限于此,汉字创意所流露的思维存在和表现技巧手法,能够良好地运用到现代艺术设计等视觉传达设计过程中,产生独树一帜的创
2017年中央一号文件指出"推进区域农产品公用品牌建设,支持地方以优势企业和行业协会为依托打造区域特色品牌,引入现代要素改造提升传统名优品牌",旨在做大做强优势产业,打造
集中监控和数据信息处理技术可有效整合资源,推进协作,增强企业竞争力。文章对风电领域集中监控管理模式进行了说明,分析了集中监控管理的目标要求,探讨了集中监控及信息处理技术
为扩展天然染料染色的色谱范围,弥补天然染料染色缺乏绿色的问题,选用2种植物染料青黛与姜黄对柞蚕丝织物进行套染拼色研究。研究了染料浓度、pH值、温度和时间对柞蚕丝织物
<正>目的:建立大鼠高原脑水肿动物模型,为研究高原脑水肿的发病机理及防治措施建立实验平台。方法:健康雄性SD大鼠40只,随机分为平原对照组(PC组)和高原缺氧组(AH组)。在平原
以黄瓜品种‘新春4号’为材料,研究干旱胁迫下一氧化氮(NO)和钙离子(Ca2+)处理下黄瓜的生根指标、内源Ca2+荧光强度以及抗氧化酶(超氧化物歧化酶SOD、过氧化氢酶CAT、抗坏血酸过
以碳化二亚胺为激活剂,使低分子量聚乙烯亚胺(PEI)上的氨基与柞蚕丝素蛋白侧链上的羧基反应,从而获得阳离子化改性的柞蚕丝素蛋白。Zeta电位测试结果表明,改性后柞蚕丝素蛋白的
我院2000年1月~2006年6月收治28例低血钾型周期性麻痹。低血钾型周期性麻痹是神经科的常见病。表现为反复发作的迟缓性骨骼肌无力和瘫痪。临床上以低血钾型为最常见。发病原因