基于模拟退火算法和二阶HMM的Web信息抽取

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:zhou8859
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统隐马尔科夫模型对初值敏感和未考虑历史状态的问题,提出了使用模拟退火算法训练二阶隐马尔科夫模型参数的SA-HMM2。在基于SA-HMM2的Web信息抽取方法中,采用基于视觉的网页分割算法VIPS对网页分块得到状态转移序列,利用提出的SA-HMM2训练算法获取HMM2全局最优模型参数,用改进的Viterbi算法实现了Web信息的抽取。实验结果表明,该方法在平均综合值方面比HMM、GA-HMM分别提高约21%和7%。
其他文献
生物自其在地球上出现就与环境有着紧密的联系,人类在长期的生活和生产实践中早已注意到这种关系,并自觉或不自觉地运用这种规律来指导自己的行动。朴素的生态学思想早在公元
液压机工作缸及回程缸是主要工作部件,其工作性能直接影响到液压机整体加工质量及工作效率,因此对工作缸及回程缸液压回路的合理设计及液压元件的恰当选型是提高锻造效率和锻
我国服装业发展中存在着宏观失控,盲目发展,低水平延伸,设计与产业脱节,工艺技术落后,相关行业不相适应,市场发育不健全等问题。故要发展我因服装业,必须实施品牌战略,调整产业结构,培
试验结果表明,植物激素对杉木种子发芽势、发芽率、田间出苗数、杉木幼苗生长及苗木出圃合格率均有显著影响。以赤霉素浓度25×10-6的溶液处理杉木种子的效果最佳。种子处理后宜稀播
高等教育管理体制的改革创新,是促进高校管理水平全面发展与提升的重要基础与基本保证。因此,本文对我国高等教育管理体制的改革创新的现状进行有效的分析,并对我国高等教育
上大学的时候看《放牛班的春天》,整颗心随马修老师和孩子们的变化而动,为孩子们的不幸遭遇而落泪,为刻薄的校长粗暴对待孩子而愤恨,为马修老师巧妙地引导孩子成长而赞叹,为
针对当前有关生态产业链(EIC)利益均衡和稳定性的研究较少考虑到动态性的现状,文章指出交易量间关系是引起EIC中企业间利益均衡具有动态性的关键因素。进而分析了EIC的结构和运
在2007年出版的《萧友梅编年纪事稿》①中,刊登了一幅1926年摄于国立北京艺术专门学校②(下文简称“北京艺专”)的照片(见图1)。片中除了中国教师刘天华(左一)、萧友梅(左二)
为了了解北京服装企业知识产权保护现状,对北京16家服装企业发放调查问卷,以便获得服装企业对其商标权、专利权和著作权的保护现状,及遭遇的侵权纠纷等一手资料。问卷调查结
目的通过分析膀胱排空及充盈状态下宫颈癌后装治疗计划的剂量分布,了解膀胱两种状态对剂量分布的影响。方法对5例宫颈癌患者分别行膀胱排空及充盈状态盆腔CT扫描,设定A点剂量为