基于TextRank和簇过滤的林业文本关键信息抽取研究

来源 :农业机械学报 | 被引量 : 0次 | 上传用户:kingsword001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,获取林业文本关键信息存在2个问题:关键信息获取主要从关键词角度考虑,忽略了词语的信息类型;网络上的林业文本没有统一的记述结构,词语信息类型提取困难。为此,本文提出了基于改进TextRank和簇过滤的林业文本关键信息抽取方法,以“关键词+信息类型”两部分表示文本关键信息。首先,抽取关键词并进行Word2Vec向量化,然后通过构建融合词语特征值、边权值的图模型对TextRank进行改进,对经迭代收敛得到的稳定图进行归并聚类形成簇;然后,设计簇品质评价公式进行簇过滤,再次应用TextRank形成最终簇集合
其他文献
冶金流体力学是冶金工程专业本科生一门重要的专业基础课,而连铸结晶器内流动过程是冶金过程流体力学教学中的重点。为了使同学理解连铸过程结晶器内多相传输过程,根据相似比
通过对企业采购与招标电子商务平台的业务流程的梳理,对企业建立良好的电子商务平台提供了决策依据与实现的可能。从而最终实现简化企业采购部门的工作内容、提高办公效率、规
腊寨水电站具有水头较高,水库含沙量较大,冲沙底孔距电站取水口较远,底孔泄流量较小等特点,采用目前常规冲沙底孔排沙措施是不可行的。利用导流洞进口天然地形条件,在大坝上
创新型国家建设并保持持续的国际竞争优势,对人才培养提出了更高的要求。探索更为宽广的实验教学模式改革路径,显得尤为迫切。针对实验教学存在的内容缺位、内涵模糊、过程控
为了能直观地观测驱油过程并更准确地分析降黏剂作用效果,采用了可视化玻璃平板模型评价方法。该模型能自制符合油藏条件的模拟地层,物模驱油过程可通过玻璃板观测并录制,再
结合本校资源与环境工程学院的实验室管理现状,从实用性、安全性的角度出发,设计并实现了一个面向安全管理全过程的实验室信息系统。该系统面向实验室安全管理的全过程,包括
【正】 长期以来,我们的史学理论混淆了一个基本的问题,即混淆了作为客体的历史和作为主体对客体的认识的历史学的区别,因而在很多方面陷入困境,引起了大量的争论,阻碍了历史
笔者小时候就学过写毛笔字,但当时没有用心跟着老师勤加练习,始终没学成功。现在如果有人要笔者重新拿起毛笔写字,恐怕比登天还难。呵呵,不要灰心嘛!信息时代一切皆有可能,
冲积性河流游荡性河道河势摆动调整往往对两岸防洪安全带来重大影响,通过对黄河小北干流多年河势资料的统计整理,以主流线几何形态及摆动幅度为参数,采用相关分析的方法研究
现在的播放器软件可谓是琳琅满目,功能越来越强人,让人目不暇接,真有点“不知道用什么好”的感觉。不过,如果现在有一款免费、小巧的多媒体播放程序放在你的面前,她使用我们熟悉的语言,提供更多特色的DVD播放,几乎支持市面上流行的各种影音文件,只占用很少的系统资源,播放流=流畅,你还会拒绝吗?她就是今天我们的书人公-zoom Plaver,除此之外,更重要的是,她还有很多非常好的特色功能,因而成为KMPl