论文部分内容阅读
移动互联网环境下,移动图书馆服务开始兴起。移动图书馆用户评论的研究基本处于初期的摸索阶段。关于移动图书馆用户评论的研究尚不成熟,忽略了移动图书馆用户评论自身的特点,缺乏适合移动图书馆用户评论的处理工具。因此,为了获取用户对移动图书馆服务平台的评价,本文对移动图书馆用户评论,进行特征分析,通过文本处理的方式,了解用户的需求,尤其是用户的隐性需求,进而为移动图书馆相关人员进行进一步研究提供数据支撑,为用户提供更优质的服务。笔者通过文献调研,了解移动图书馆用户需求研究现状、用户评论数据研究情况和文本处理相关技术;通过与超星公司合作,获取到移动图书馆用户评论数据(主观题嵌入到问卷调查+移动图书馆后台服务器数据);从用户移动图书馆用户评论出发,结合文本信息处理的流程,全面分析评论特征,包括评论的基本特征和差异性特征,在此基础上构建移动图书馆词典,基于评论语料、CNKI语料、现有词库借鉴与扩展等多渠道收集词条,最终形成包含43826个词条的移动图书馆词典。利用移动图书馆词典对用户评论进行分词,对移动图书馆用户评论进行聚类研究,结合移动图书馆用户评论的特征,对聚类算法适当改进以适应移动图书馆用户评论的场景,并测评移动图书馆词典对聚类结果的影响。基于以上研究内容,搭建移动图书馆用户评论自动聚类系统,以期为后续评论处理提供简易的工具。本研究发现,在以移动图书馆用户评论部分数据实验为测试集中的测评结果显示,本研究所设计的聚类效果更好,聚类的准确性、稳定性、F值等评价指标明显优于传统K均值算法,验证了算法改进的有效性、合理性。在移动图书馆用户评论测试语料中,使用移动图书馆词典进行聚类的结果的F值明显高于使用结巴自带词典的聚类结果,移动图书馆词典聚类效果明显优于结巴自带词典聚类效果,且移动图书馆词典聚类的稳定性明显优于结巴自带词典聚类。用户评论自动聚类系统(包括数据导入模块、预处理模块、数据分析模块、聚类结果展示模块和查询模块)应用到移动图书馆中,快速有效获取到用户需求,验证了方法的有效性。根据聚类结果进行初步分析,本文认为:移动图书馆服务平台应注重资源质量与数量,细化并拓展平台的外延服务,增加更多的实用功能。简化用户操作,提供合理友好的容错机制和安全隐私保密政策,提升系统技术质量。激励用户参与,支持线上线下交流,提供个性化的定制服务。平台设计者、开发者们应充分利用技术,比如说利用图层压缩技术缩小app所占的内存空间,减少流量等资费支出,降低用户的使用成本;考虑到电子屏幕对用户视力的影响,不妨借鉴其他软件,比如Word护眼模式等,关爱读者视力健康。