基于概念统计的英文自动文摘研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:huawei_2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文章提出了一种基于概念统计和语义层次分析的自动文摘方法,并以此实现了一个英文自动文摘系统,系统利用WordNet对英文文章进行词语分析,用概念统计的方法选取文章的主题概念,以此构建向量空间模型;并根据主题概念在概念层次树上的分布划分意义块,以意义块为单位抽取文摘,初步解决多主题文章的文摘结构不平衡问题,该文主要介绍概念层次树的构造,主题概念的抽取步骤,句子重要度的计算和意义块的划分算法,测试表明该文提到的方法比传统的基于词频统计的方法有更高的召回率与精确率。
其他文献
文章描述了一种基于可见边的平面细分遍历算法。该算法不需要增加标志位,也不需要堆栈和队列,只使用O(1)的辅助内存空间,并且充分利用了边的可见性,对于面集为F,每个面f上有|f|条边
前人对东魏北齐时期邯郸县设治问题的研究存在两种截然相反的观点——“撤治说”和“设治说”。河北省磁县出土的《窦奉高墓志》记载窦氏在北齐时期被授予“邯郸县伯”的爵位
中医理论认为瘀血的产生与阴伤、气虚等因素有关。阴伤导致血脉枯涸,血行不畅,气虚则推动无力,都可以引起瘀血。其中因阴液亏虚而至瘀血者,被称为“无水舟停”:气虚而致瘀血者。被
浮选法最初被应用在矿石行业,今年来,随着浮选技术的发展,我国在废水处理问题上浮选法也得到了广泛的应用。我国的进行浮选的设备处理量大,效率高,所以应用前景也很乐观。在
介绍了ECM-Ⅵ粉末包封机控制系统,包括温度控制、PLC控制、伺服电机驱动控制及可编程终端的设计.
在进行医疗设备应用的过程中,需要建立一个全生命周期的质量控制管理系统,只有这样才能对医疗设备的应用情况进行全方面的了解。但是现阶段很多医疗机构在对设备进行管理的过
对四倍体和二倍体灯盏花的形态学和细胞学进行了观察、测量和比较,鉴定了四倍体与二倍体的染色体。结果表明,四倍体灯盏花植株具有巨大性.花梗粗壮,叶色浓绿、叶片巨大而肥厚.花朵
为推动贵州农业科技创新人才队伍建设,通过对贵州省属17个农业科研机构创新人才队伍的现状调查,分析了制约农业科技创新人才队伍建设的因素,提出了加快农业科技创新人才队伍
采用22%草无影可湿性粉剂进行水稻田杂草防除试验,结果表明:25~30g/667m^2剂量处理效果最佳,施药时期为水稻秧苗插秧后7d左右,在试验计量范围内对水稻生长安全.