基于语义与情感词典的微博评论情感分析方法

来源 :现代计算机 | 被引量 : 0次 | 上传用户:lhchg1982
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本研究采用哈工大语言技术平台进行分句、分词和词性标注,结合知网情感词典进行情感词统计,情感副词、语气标点加权获得文本情感得分,构建了新的算法.该算法对传统的情感词典打分方法进行了延伸和拓展,加入了上下文语义要素,考虑了情感词前置副词的语义加强效果,增加了句子结尾标点语气效果的权重.经测算,算法效率较高(0.12秒/条),准确率可达96.7%.在旅游定性和定量研究中,对文本大数据进行分句、分词和情感分析的工作,采用本算法可极大提高研究工作的效率.
其他文献
现阶段,我国的居民用车数量持续快速增长,居民对城市道路的需求也与日俱增,我国城市交通还存在很多问题,其设计规划需要更加合理,并需与我国道路交通的可持续发展理念达成高度统一.针对城市道路交通设计中存在的问题进行分析和研究,从而得出有效的问题解决对策.
为研究集料波动对沥青混合料水稳定性的影响,通过浸水马歇尔试验和冻融劈裂试验对沥青混合料的水稳定性进行评价,在此基础上采用灰色关联分析法评价集料的针片状颗粒含量、砂当量、粉尘含量、4.75 mm通过率、2.36 mm通过率和0.075 mm通过率6种因素对沥青混合料水稳定性的灰色关联度及其排序情况的影响.结果 表明,对沥青混合料水稳定性影响最为显著的为4.75 mm通过率,其余依次为2.36 mm通过率、砂当量、0.075mm通过率、粉尘含量和针片状颗粒含量.
道路交通的规划建设在城市规划中至关重要,从广州西华路与东华路的建设历史切入,通过西华路和东华路的变迁,探析西关和东山的发展历史及其繁盛兴衰的原因,由此挖掘道路交通规划与城市发展的关系.
针对配对交易策略目前存在的套利空间小、投资收益低等问题,本文基于强化学习算法构建配对交易策略,并以2010-2016年期间美国公共事业股的收盘价作为研究对象,验证配对交易策略的投资绩效.研究结果表明,相较于传统的配对交易策略,基于强化学习算法的配对交易策略避免了经验参数对于交易结果的不利影响,可以更好的捕捉潜在的交易机会,在夏普比率、年化收益率等指标上表现更加优异,因而将强化学习算法引入配对交易当中可以为投资者提供一种有效的套利手段和风控工具.
本文采用“数据世界”官网的IMDB电影数据集,该数据集涵盖66个国家、跨越100多年的5000多部电影,含有影片时长、导演、票房、成本等28个变量,其中“imdb_score”为响应变量,其它为预测性变量.本文针对上述数据集通过数据分析处理,采用数据挖掘技术中的随机森林算法以及BP神经网络进行评分预测和性能检验.最后,基于最优的随机森林预测模型对15部新电影评分进行预测,预测结果良好.在IMDB电影排行榜中,得分越高(满分10分)则代表影片越精彩,值得观看.本文研究目的是预测精彩有意义的电影,节省时间满足
基因表达数据隐藏着丰富的生物信息,双聚类算法是挖掘这些生物信息的有效手段.双聚类算法一直被认为是一个NP-hard问题,而蝙蝠算法在解决NP-hard问题上有很大的优势.本文在蝙蝠算法的基础上提出了一种基于改进蝙蝠算法的双聚类算法(Bi-clustering based on Improved Bat Algorithm,BIBA).通过在酵母细胞基因数据集上的实验表明BIBA算法能够得到MSR值更小、体积更大的双聚类.
探讨使用量化方法为高校精准扶贫工作提供理论依据和技术支持.后扶贫时代,相对贫困依旧存在,而家庭经济困难学生认定工作是高校扶贫工作的重中之重,也是各大高校在扶贫工作中容易遇到的难点.本文在校园一卡通消费的大数据基础上,利用数据挖掘技术构建学生消费特征数据,最终生成家庭经济困难生认定的聚类模型.通过与实际经济困难生数据做对比,发现本模型具有较高的识别率,能够为高校家庭经济困难生的认定提供技术支持,具有一定的实践应用价值.
提出一种机场净空区“低小慢”飞行物的风险评估方法.该方法利用外辐射雷达和ADS-B分别获取实时的“低小慢”飞行物信息和飞机航班信息,并结合机场净空区信息,实时评估风险.以机场跑道建立净空全坐标系方程,将飞机航班信息和低小慢信息转到同一坐标系中.利用层次分析法,建立风险评价模型.该模型充分结合了“低小慢”数据、飞机航班信息和机场净空区信息,实现了目标威胁评估可量化,能够为机场提供多种决策能力,筹划多个行动对抗方案,实时实现低空安全目标防御全流程标准化、可视化和自动化.
熵值法作为一种较为客观的评价方法,对采集到的数据进行分析计算,根据异变程度来确定权数,不会因为人为因素而给最后的结果带来不可控性.本文对熵值法评价模型进行了研究,设计和开发用于收集评分的系统.在该系统中可以设置对应熵值法的评价指标.系统基于PHP开发,实现了权重指标设置、评教、评教结果查询的功能,同时收集了相关的评教数据.最后将熵值法与传统经验法收集的评教数据进行了对比分析,从而验证了熵值法在数据的可信度和科学性方面具有一定的优势.
本文设计一种适应电力行业的云平台一体化开发框架和资源调度模型算法,阐述了云平台开发生产一体化架构,给出了云平台网络和资源分配方法,结合云平台框架设计了通信流量资源调度算法,通过实验验证了模型方法额可行性和有效性.