信息抽取算法研究

被引量 : 0次 | 上传用户:q1104
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文对应用于信息抽取的三种算法进行了研究。本文首先分析了在文本信息抽取中如何建立隐马尔可夫模型(Hidden Markov Models, HMM)的结构和参数训练等问题,运用改进的HMM和数据稀疏平滑技术结合特征提取对基于分块的文本进行抽取,实验证明,召回率和精确度比基于单词和传统HMM的方法都有很大的提高,并提高了效率。在改进HMM和Viterbi算法这种几乎是信息抽取领域标准算法的同时,本文也提出利用反向动态规划和正向A*算法进行信息抽取,并建立了一个信息抽取系统。本文对美国CMU大学CORA搜索引擎研制组提供的数据集中的100篇进行了测试,结果显示启发式算法的性能优于Viterbi算法。在中文的命名实体识别方面,本文也做了一些研究。本文设计了一个中文姓名抽取系统,该系统采用神经网络进行汉语句子的分词处理,继而根据姓名后置特征词进行姓名的抽取,成功解决了尾字和下文成词的姓名抽取问题。
其他文献
本文以米糟为原料,采用酶法和碱法、凝胶分离技术、高效液相色谱分离技术、质谱等手段,研究了提取米糟中蛋白质的工艺条件、大米蛋白质改性、血管紧张素转换酶(ACE)抑制肽和
本文在研究政府新闻发言人制度时,以理论界定为逻辑起点,以理论阐释为文本重心,以期为目前我国大力建设政府新闻发言人制度的实践提供理论支撑。 文章由六部分构成: 引
渗流控制与渗透稳定性分析是土石坝工程中的一个重要课题,直接关系到大坝的经济效益与安全问题。论文分析和研究了西藏自治区贡嘎县江雄水库大坝坝区的工程地质和水文地质条
采用连续充水、整体升压,按试压段不同的压力要求,当试验压力值达到要求时,关闭该旁通阀进行分段保压、检查。保压检查无异常时,再按加压顺序的逆向操作,遂级卸压连续放空。
<正>2006年2月财政部发布了《企业会计准则第15号——建造合同》,新修订的建造合同准则对建造合同的确认、计量和相关信息的披露进行了规范,对施工企业的管理提出了更高要求
随着我国市场经济的不断发展以及产业结构的不断升级调整,施工类企业经营管理的环境发生了很大的变化。近年来,国家不断的推进营业税改征增值税的试点,并提出在未来逐渐将建
在企业价值评估中,现金流量贴现法是最具有理论意义的估价方法,是其他估价方法的基础。现金流量贴现模型己成为企业估价中的主流模型而得到广泛的应用。如何预测未来现金流量,是
目的 :探讨汉语阅读障碍 (RD)儿童的认知功能特点。方法 :符合ICD -10阅读障碍诊断标准的 172例患儿和 6 3例正常儿童纳入研究 ,以韦氏儿童智力量表 (C -WISC)和韦氏记忆量表
苏州河河口水闸为水下类闸门,孔口巨大,无法承受船只的直接撞击,为保障水闸及该水域的通航安全,设计了水上安全防撞设施,由图像监控系统、交通信号系统、广播系统、投光系统
从文献整理研究的角度,对中医"从化"学说进行了初步探讨,纠正了以往对"从化"的片面认识。认为:"从化"不仅指病情随体质而发生变化。除此之外,"从化"尚有多种内涵。"从化"学说
期刊