基于组块的中文自动文摘系统研究

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:luoming106
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的基于统计的自动文摘方法以词语作为文本信息的基本单位。没有考虑到词语在不同语言环境下的具体语义,导致文摘精度不高。为了克服传统方法的缺点,提出了一种基于文本组块的自动文摘方法。系统利用中科院的ICTCLAS软件对文档进行分词和词性标注。并根据一系列的规则,将相关的词语构造成组块。由句子中出现的组块作为衡量句子重要性的标准选出文摘句。文中给出了自动文摘的评价方法和实验结果。跟传统的基于词语的文摘相比较,实验结果表明基于文本组块的自动文摘系统生成的文摘句精度更高.更能全面反映原文的主要内容。
其他文献
在实际生产中对八辊磨粉机1皮、2皮进行研磨试验,通过流量的变化及1皮与2皮轧距的组合,测得不同工况下的研磨剥刮率、取粉率、耗用电流、研磨物料粒度分布及分级物料的灰分,研究
<正>江泽民同志说:"创新是一个民族进步的灵魂,是国家兴旺发达的不竭动力。""创新的关键在人才,人才的关键靠教育。"人才的培养是一个民族发展和进步的先决条件,培养学生的创
会议
急性脑卒中患者,由于年龄偏大、肢瘫、卧床、肺呼吸道功能差,并伴有饮水呛咳、意识障碍等易合并多种感染,给临床治疗护理增加了一定的难度,通过几年的临床观察和护理,采用多
目的研究乳腺癌术后化疗患者接受PICC护理的效果。方法选择38例进行乳腺癌手术化疗的患者,之后对全体患者做PICC化疗药物输入,同时实施护理干预。结果本次38例患者的置管工作
在中国大力提倡继承非物质文化遗产,设计文化走向世界之时,深刻认识汉字在商业设计中的个性语言,摸索汉字造型的客观规律与更广泛的表现力,是一个重要课题。一个商业平面设计
供应商管理是煤炭企业物资采购管理中的重要组成部分,直接关系到煤炭企业生产运营的持续安全和稳定。为了解决传统供应商管理中信息沟通不畅、合作层次不高以及业务数据不共
<正>近年来,人们将动物繁殖生理的注意力集中于利用免疫系统影响内分泌系统功能,从而改变动物的繁殖性状。激素免疫其实质是人工诱导动物体内产生靶激素的抑制素的问题,而这
《论语》之"权"含蕴有德性义、智慧义与实践品质,因此可被视为最与亚里士多德之实践智慧相侔者,同时它还具"儒家实践智慧"之特质。余纪元先生以"义"为《论语》之实践智慧,但其论述
提出并研究了一种新颖的钟摆式光纤光栅(FBG)二维倾斜角传感器,其摆杆顶端采用圆锥结构,两个FBG沿着母线方向并间隔四分之一圆周粘贴在圆锥表面,摆杆下端固定一定质量的重物
化工仪表及自动化是化工类学生的专业基础课,旨在培养学生掌握最基本的自动控制方面的知识,在实际生产中为自控系统的设计提供合理、准确的工艺条件及数据参数。针对传统的教