【摘 要】
:
[目的/意义]对近几年的人民日报语料中文分词结果进行统计和分析有利于总结新时代的中文语料在分词歧义方面的规律,提高分词效果,促进中文信息处理的相关研究和技术的发展.[方法/过程]本文以2015年以后的共4个月新时代的人民日报分词语料为研究对象,通过统计词频、词长、从合度等信息,从名词、动词、数词、量词、副词、形容词、区别词、方位词、处所词、时间词、代词、介词、连词、助词、习用语、否定词、前后缀等类型来讨论变异词的切分规律.[结果/结论]结果发现新时代的人民日报语料中的切分变异大部分为假歧义,相同语法结构的
【机 构】
:
南京农业大学信息管理学院,江苏南京210095;南京农业大学人文与社会计算研究中心,江苏南京210095
论文部分内容阅读
[目的/意义]对近几年的人民日报语料中文分词结果进行统计和分析有利于总结新时代的中文语料在分词歧义方面的规律,提高分词效果,促进中文信息处理的相关研究和技术的发展.[方法/过程]本文以2015年以后的共4个月新时代的人民日报分词语料为研究对象,通过统计词频、词长、从合度等信息,从名词、动词、数词、量词、副词、形容词、区别词、方位词、处所词、时间词、代词、介词、连词、助词、习用语、否定词、前后缀等类型来讨论变异词的切分规律.[结果/结论]结果发现新时代的人民日报语料中的切分变异大部分为假歧义,相同语法结构的二字词要比三字词、四字词的切分变异从合度更高.[创新/局限]本文首次面向新时代的人民日报语料讨论了中文分词歧义的问题,但缺少与旧语料的对比分析.
其他文献
[目的/意义]随着社会信息化的不断深入,推动了教育教学的创新发展,同时也对教育中工作者的教育教学活动提出新的挑战.[方法/过程]本文从大数据时代信息化特点出发,分析了信息化建设对教育变革的影响,阐述了信息在教育变革作用、教育信息化管理以及对策,构建信息技术与教育融合创新体系结构;大数据时代怎样激发教师教育工作者转变思想观念、迎接挑战.[结果/结论]通过对大数据时代,信息化建设对教育影响,揭示了随着教育技术的不断进步,正在提升教育信息化程度,对教学资源和教学环境、教学方式、教学管理与教学评价方面引发的变革,
[目的/意义]研究从用户群体的角度出发,依据用户特征对社区用户进行群体划分,以了解不同用户群体的主题差异,从而更加全面清晰的了解社区主题,更好的为社区用户推荐资源.[方法/过程]研究利用社会网络分析和Topsis算法对用户群体进行划分,再利用LDA模型分别对不同用户进行主题挖掘,最后采用谱聚类实现主题优化.[结果/结论]科学网情报学社区的核心用户与一般用户群体主题有相同的部分,也存在差异,核心用户群体的主题专指性较强,一般用户群体的主题较为广泛.基于虚拟学术社区用户群体主题挖掘模型,可以更加全面展示社区用
[目的/意义]文章从全球共融的创新环境出发,分析高校科研行为中知识产权的复杂性问题,从而提出高校图书馆专门面向科研的知识产权信息服务,以更好地推动创新,支持“双一流”建设.[方法/过程]基于已有的国内外高校知识产权信息服务的实践经验及启示,文章结合高校图书馆知识产权信息服务及数据共享与管理服务的优势,提出高校图书馆面向科研的知识产权信息服务的框架,进行运营模式、服务策略及服务内容分析.[结果/结论]文章提出的图书馆服务运营模式及服务策略,适用于当下的国际科研环境,可作为同行的实践借鉴.[创新/局限]基于目
[目的/意义]当前民族文化资源的流失严重,现有民族文化资源共享方法的资源共享利用率和资源完整度较低,因此设计了基于MB+树检验方法的民族文化资源共享模型.[方法/过程]资源采集子系统通过爬虫技术爬取民族文化资源存储至资源库;采用基于MB+树检验方法,完成共享资源的检验,提取民族文化共享大数据的关联特征量,获取多模块协同数据挖掘的聚类中心,采用区域网络化组网设计的方法,获取资源共享模型.[结果/结论]测试结果表明:系统的成功爬取请求比例为99.76%,可在资源完整性高于95%的情况下完成资源实时传输需求,同
[目的/意义]社交媒体在改变新闻传播以及人类获取信息方式的同时,也成为了虚假新闻传播的主要渠道.因此,快速识别社交媒体中的虚假新闻,扼制虚假信息的传播,对净化网络空间、维护公共安全至关重要.[方法/过程]为了有效识别社交媒体上发布的虚假新闻,本文基于对虚假新闻内容特征的深入剖析,分别设计了文本词向量、文本情感、图像底层、图像语义特征的表示方法,用以提取社交网络中虚假新闻的图像特征信息和文本特征信息,构建多模态特征融合的虚假新闻检测模型,并使用MediaEva12015数据集对模型性能进行效果验证.[结果/
[目的 /意义]文本情感分类是近年来情报学领域的研究热点之一.已有研究大多关注针对目标文本的单一情感分类.本文旨在探索基于深度学习的电商评论信息多刻面情感分类方法.[方法/过程]提出一种基于Atten-tion-BiGRU-CNN的多刻面情感分类模型,通过BiGRU和CNN获取上下文信息和局部特征,利用Attention机制优化隐层权重,以深度挖掘文本内隐语义和有效刻画多刻面情感.[结果/结论]在中文电商评论信息语料上的实验表明,相较于其他神经网络模型,本文方法可有效提高多刻面情感分类的准确度.[创新/局
[目的/意义]突发疫情环境下将形成大量网络舆情,准确把握网络舆情传播趋势可为突发疫情环境下的社会保障应急机制提供参考依据.[方法/过程]本文从网络舆情信息交互影响要素、网络舆情信息交互机理两方面分析突发疫情环境下网络舆情信息交互机理;并从网络舆情传播趋势特点考虑,以新冠病毒肺炎李文亮事件为例,采用Elman神经网络模型,选取网络信息数量以及情绪总量和主导情绪作为网络舆情传播趋势预测主要变量和辅助变量,对突发疫情环境下的网络舆情传播趋势进行预测分析,针对预测结果制定相关社会保障应急机制.[结果/结论]研究提
[目的/意义]跨学科是当今科学发展的显著特征,以跨学科研究特征为主的跨学科性研究探索,不仅为厘清跨学科研究主题提供重要线索,而且为跨学科研究管理和评价提供依据.[方法/过程]以跨学科性研究为研究对象,借助Coherence Score与LDA相结合主题挖掘模型识别跨学科性研究的主要主题,并通过文献计量法从宏观和微观层次探索跨学科性研究演化特征.[结果/结论]结果显示,对跨学科研究的跨学科性评估正处于快速发展期,跨学科研究不仅来源于社会科学、生态学等学科跨界探索的内在驱动,也源于气候变化、生态环境脆弱性等复
[目的 /意义]研究在线医疗社区医生主页中的医生文本信息与图片信息对患者择医行为的影响,期望为患者在线择医行为的研究提供更深入的多源信息融合方面的理论依据,并为提高在线问诊的服务质量提供参考意见.[方法/过程]本文以信任源理论为基础,从影响信任的声誉可信度、能力可信度和面孔可信度三个维度出发构建患者在线择医模型,收集春雨医生网站文本、图片和其他相关信息,基于深度学习,识别医生照片中的面孔特征,并基于多源信息,通过回归分析验证理论模型.[结果/结论]医生的声誉可信度对患者择医行为有显著的正向影响,而医生的能
[目的/意义]大数据、人工智能(AI)、5G网络等信息科学技术为前沿的新一轮技术变革加速了知识更替,教育终身化理念已成为大众普遍认同的知识获取模式.深入分析受教育者的信息吸纳过程和结构,挖掘其吸纳效率的影响要素,对高技术应用、社会教育水平提升及教育信息化发展均具有重要现实意义.[方法/过程]本文将从终身教育驱动下的需求-供给关系对应的动态、多维、网络系统进行作用过程及结构分析,并通过灰色关联分析量化受教育者对知识信息吸纳效率的关键影响因素,从而针对性地提出终身化教育主体助力知识信息吸纳效率提升的关键要素.