服务于内容侧面发现的框架识别

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:kuaile6789
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本内容通常包含多个侧面,全面地识别这些内容侧面对自然语言处理有重要地意义。传统的统计方法使用简单特征难以识别出所有的内容侧面。以自动摘要为例,传统的抽取式方法多以词频为主要特征,一些重要的句子常因重复度不高被舍弃。要想全面地覆盖原始文本的重要信息,就要识别出文本描述的内容侧面。该文以框架语义学为指导,使用FrameNet语料库作为知识库,综合多种特征来标注文本描述的框架,在此基础上识别文本所包含的内容侧面。该方法在新闻语料上取得了较好地结果,达到了61%的正确率。
其他文献
一个高效便捷的标注工具对树库建设起到至关重要的作用,该文在现有的基于句式结构的图解标注工具的基础上,针对其不足之处,进行了重新设计,加入词类和义项等标注信息,实现了
在传统的信息抽取中,模式匹配已经被证实为简便而有效的方法,而依存路径也是最为常用的模式之一。在槽填充任务中就有众多的参与者引入了以依存路径为基础的模式匹配方法;该文就
我国中学的写作教学存在教学目的越轨、考试设计错位、文体训练欠缺和能力培养不够四大误区。我国大学阶段应开设写作公共必修课。
学生选择教师教育专业的意向是制约我校教师教育专业建设的基本要素,是实现学生主体向专业者过渡的动力诉求,是培养和造就优秀教师、提高教育质量和建立和谐社会的必然要求。
该文从研究背景、设计思路、标注体系和方法、加工步骤等方面介绍了汉语语义倾向语料库的建设过程.该语料库是一个以研究语言主观性表达为目的的共时、非平衡、单语标注语料
了解大学生家庭期望与人际信任之间的关系。于2010-03以随机抽样的方法对昆明三所大学190人进行问卷调查,问卷包括:家庭期望问卷、信任量表。运用描述统计、t检验、相关分析等
文档表示模型是文本自动处理的基础,是将非结构化的文本数据转化为结构化数据的有效手段。然而,目前通用的空间向量模型(Vector Space Model,VSM)是以单个的词汇为基础的文档表
音乐教育专业是高等师范院校中十分重要的专业,它肩负着为社会培养各类音乐人才的重任,目前,高师音乐教育专业在教育上存在的弊端:"课程设置与定性不合理"、"功利思想突出"、"培养
该文提出了一种基于衰退理论对Flickr数据进行热点事件检测的方法。该方法首先将从Flickr图像中提取的视觉词汇(Visual Words)与图像的文本信息加权合并成文档。然后训练LDA模型获得文档的主题分布作为其最终向量表示。在此基础上提出了一种改进的Single-Pass算法进行事件检测,该算法不仅考虑了图片的地理位置信息,而且基于衰退理论(Aging Theory)对检测到的事件进行生命周
计算机科学国家重点实验室于1994年12月经中国科学院批准正式对外开放,2005年1月经科技部批准开始建设国家重点实验室,2007年9月通过验收。实验室依托于中国科学院软件研究所,从