基于概率模型的网页相关度研究

来源 :全国第八届计算语言学联合学术会议 | 被引量 : 0次 | 上传用户:jiexp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于内容的网页相关度评价是提高网上信息检索服务质量的核心问题.本文以北大计算语言学研究所构建的名人实体网页语料库为基础,主要研究了中文名人实体网页的相关度评价问题,以满足用户定制的个性化检索需求.作者设计并实现了基于概率模型的名人实体网页相关度评价算法,总结其中的规律,提出了一种自动获取训练集以使检索自动化的方法.实验表明,概率模型提高了网页相关度评价的准确率,从而提高了检索服务质量.
其他文献
本文构造了一个汉语词法和句法分析的一体化处理系统,该系统将汉语分词、词性标注、句法分析以及未登录词识别紧密地结合起来,在各模块之间实现了充分的信息共享.更重要的是,
南京军区南京总医院耳鼻咽喉头颈外科由我国耳鼻咽喉科鼻祖胡懋廉教授于1931年创建,王鹏万、钱士良、肖轼之和王庭芳等教授曾任科室主任,现任主任为王秋萍教授。
缩略语是自然语言语汇的重要组成部分,是未定义词的主要来源之一,因此,缩略语研究也是自然语言处理的一个重要课题.本项研究的最终目标是探索中文缩略语(简称)的规律,包括缩
会议
本文提出了一种基于规则和统计的汉语浅层句法分析方法,即运用浅层句法分析理论,把汉语句子分析分为谓语的提取、组块分析以及主语和宾语的确定三个步骤.文中给出了句子分析
词类知识的粗糙和不完备是影响自动句法分析的一个重要因素.本文以"V+V"结构序列为切入点,彻底按照词的句法功能对动词进行分类,句法功能完全相同才给以相同的标记.这样可以
现阶段的蒙古文语料库加工、文本校对、文字识别及机器翻译等工程迫切需要面向信息处理的蒙古语句法、短语研究.本文通过对语料样例进行分析,概括出蒙古语属格短语的三大类型
会议
汉语的句法结构可以从多角度、多层次进行分析,但如果服务于框架语义分析,则有其特定的要求.本文试图构建一个汉语句法分析模型,它是一个词汇化的句法分析模型,能够解决框架
会议
本文以"手"为例,分析了汉语字的语义结构和字组的语义组合模型.基本方法如下:首先收集相关字典语义解释,并对其义项进行归并,然后提取抽象类义,确定定义特征及构词的内涵特征
会议
语义自动分析的主要问题是借助语义语言实现词汇、句子和文本意义的模式化.因此,建立语义语言和语义词典就成为语义自动分析的基础.其中,语义词典的构建和完善工作尤其重要.
系统构成系统配置图如图1所示,下位机采用功能强、可靠、易维护及现场抗干扰能力强的OMRON可编程控制器PLC,包括对温度、压力、液位、可燃气报警、电动阀状态等现场数据进行