基于文本分块的多模板隐马尔可夫模型的文本信息抽取

来源 :山东大学学报(理学版) | 被引量 : 0次 | 上传用户:zbt_25
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对文本信息抽取中训练数据来源的多样化,不利于学习到最优的模型参数的问题。提出了一种基于多模板隐马尔可夫模型的文本信息抽取算法.新算法利用文奉排版格式、分隔符等信息,对文本进行分块,在此基础上。通过对训练数据分成多个形式模板训练隐马尔可夫初始概率及转移概率参数,最后,结舍统一训练的释放概率参数,对文本信息进行抽取.实验结果表明,新算法在精确度和召回率指标上比简单隐马尔可夫模型具有更好的性能.
其他文献
给出了分式半环的概念和泛性质.
给出了拟阵的基关联图的概念,证明了若拟阵M为简单拟阵,M的秩为ρ=ρ(M)≥2,则M的基关联图Δ(M)的连通度等于它的最小度.
设图G是连通的K1,n-自由图,即不包含K1,n作为导出子图的图.g(x),f(x)是定义在V(G)上的非负整数函数,且g(x)f(x).若G的一个支撑子图满足对任意的x∈V(F),有g(x)dF(x)f(x
给出了滤波多音调制系统容量的理论分析,证明滤波多音调制系统的系统容量取决于其原型滤波器的特性.提出了基于滤波多音调制系统原型滤波器的设计准则.仿真实验表明滤波多音调制
以三氯氧磷(POCl3)、季戊四醇为原料,三氯化铝(AlCl3)为催化剂,甲苯/乙腈(质量比2/1)混合物为溶剂合成了双螺环(氯化螺环磷酸酯)。当n(AlCl3)∶n(POCl3)∶n(季戊四醇)=0.015
在L-fuzzy拓扑空间中,利用Dα-闭集定义了Dα-导集,系统地讨论它的基本性质。
研究非线性双曲型微分方程组的初边值问题的交替有限元方法,对计算格式应用微分方程先验估计的理论和技巧,得到稳定性和收敛性结果.