【摘 要】
:
当今各大门户网站每天都有娱乐领域的新闻报道,娱乐新闻搜索用户关注的是如何从海量信息中获取自身所需的数据。然而目前还没有人对娱乐领域的信息自动抽取做过具体的研究,本
论文部分内容阅读
当今各大门户网站每天都有娱乐领域的新闻报道,娱乐新闻搜索用户关注的是如何从海量信息中获取自身所需的数据。然而目前还没有人对娱乐领域的信息自动抽取做过具体的研究,本研究将做一些探索工作。
本文利用事件框架自动抽取娱乐明星演出事件信息和助阵事件信息。在模式的获取和表示方面,本文注重运用语义知识分析事件的关键动词,并通过考察同一动词事件的不同表达模式来定义抽取模式。
本文的工作主要包括以下四个方面:首先建立了一个实际描述娱乐明星演出过程的新闻文本语料库;其次分析演出文本中演出事件信息和助阵事件信息的表达模式,其中助阵事件相关人物名的归属是分析的重点和难点;接着建立了包含词典和规则库的知识库资源;最后基于面向对象的编程思想,采用C#编程语言设计并实现了娱乐明星演出活动信息的自动抽取程序。
以上研究内容将为娱乐领域的相关信息抽取工作提供经验,这是本文的实用意义。
本文对娱乐领域演出信息的自动抽取研究做了一些初步的研究,一些更具体的信息抽取工作还未实现,需要更深入的研究。
其他文献
根据中共七大的经验,各地的代表提前半个月来北京参加预备会议,讨论一些问题。这次总共有一千零二十六名代表,在预备会议期间进行了两项工作:第一,讨论了政治报告、关于修改党章的报告、修改后的党章草案、关于发展国民经济第二个五年计划建议的报告、第二个五年计划建议的草案等文件;第二,预选新的党中央委员会委员,由上一届中央委员会提出名额,各代表团提出人选。这次总共有三十个选举单位(省——二十二个;自治区——三个;直属市——三个;军队——一个;中央直属机关——一个).由上一届中央委员会同各代表团团长举行会议,根据一定的
奥地利犹太人斯台芬·茨威格在中国大陆近百年的译介接受历程,如同一面镜子映射出中国几代知识分子的阅读史和精神成长史,这集中体现在茨威格的传记作品中。本文在对这些汉译作
为研究转座元件(Transposable elements,TES)在燕麦中的表达模式,以14个Ty1-copia型反转录转座子和3个Ty3-gypsy型反转录转座子序列为种子序列对燕麦属(Avena)表达序列标签(E
研究经济视角下的中国现代小说,具有重要的学术价值和现实意义。伴随着中国现代小说研究进入多视角、多层次解读的新阶段,经济视角日益成为一个不容忽视的研究视角。在观照现代
目的:了解非意愿妊娠妇女对紧急避孕知识的认知程度。方法:对本院519例接受人工流产妇女进行问卷调查。结果:有效问卷502份,81.9%的妇女有一定的紧急避孕知识,但只有65.5%的
一《、最野假期》:带领孩子重温长征历史节目类型:户外真人秀首播平台:中央电视台少儿频道主创人员:司晓峰常路加赵美美张凡毕伟等推荐理由:节目以纪念红军长征胜利80周年为
本文试图以19世纪英国中国学的发展为背景,通过分析、比较理雅各《中国经典》丛书内《诗经》的两次迥然不同翻译,以及两次翻译在理念和策略上的差异变化,展示译本所经历的从传统
翻译是语言学领域里的一个常说常新的话题,它和语言选择相关,但又不仅仅如此。在译名的背后承载着历史、文化、价值认同等问题,需要我们透过语言的表层来审视。大陆与港台地
王稼祥在“文化大革命”中受到了冲击,身心备受折磨,但他没有屈服,而是采取特殊方式进行抗争,表现了一个无产阶级革命家的崇高精神。“靠边站”1966年5月16日,中共中央政治局
《夷坚志》为洪迈历60年所写,在长期写作实践中,洪迈意识到民间是小说素材的重要来源,新闻性、自觉的小说意识等是其对小说理论的进一步发展。由于写作时间漫长,洪迈的写作动