基于机器学习的多语言文本抽取系统实现

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:zxi666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于统计机器学习的信息抽取方法正日益成为研究的热点,在研究与应用方面虽然也产生了一些实用的基于机器学习的文本信息抽取框架与系统,但大多面临着交互性弱、可扩展性低、语言移植能力差等缺陷。为此,研究并提出一种通用可行的支持多语言的信息抽取框架,并基于该框架实现了一个原型系统。原型系统集成了最大熵、支持向量机两种机器学习算法,使用这两种算法对中英文文本的实验验证了系统的实用性。
其他文献
素质教育,是一种培养和提高能力的教育。初中语文教育的根本任务就是培养学生的语文能力。语文能力涉及面广,但核心是掌握和运用祖国语言文字能力。从这个意义上讲,要培养语文能
目的:规范陆文整骨手法,评价其治疗腰椎间盘突出症效果。方法:采用三中心、随机、对照的研究方法,对233例腰椎间盘突出症患者进行规范化研究,按照简单随机数字法分为手法组和热敷
自2002年10月~2006年9月,作者采用自制拱桥式小爽板外固定治疗桡骨远端开放性骨折11例取得了满意疗效,现总结报告如下。
新课标、新课改的要求,促使各学科教师主动地挖掘出教材中有价值、有实用性的资料,深化课堂教学改革的进程,促进学生的全面发展和进步,从而切实提高课堂教学的有效性。小学数学教
部分农村地区环境持续恶化且不被重视是不争的事实,在改变农村地区环境现状、切实保护农民环境权这一问题上,应从文化传统、社会经济、法律制度、基层行政举措等多个维度进行
本文介绍了一个房地产管理信息系统。该系统功能覆盖房地产开发全过程,综合了数据库,办公自动化,地理信息系统等知识和技术。系统符合目前房地产开发实际情况,既具有先进性,同时强
<正>希波克拉底(Hippocrates,约公元前460-前377)在《古代医学论》中说:"我相信人体内没有什么性质比冷和热难以把握了。"他介绍的42例患者之中,很少提到治疗,只有三例说到了
会议
利用一种统一的阻尼模型的定量评价方法和评价指标,设计了一套适用于评价各种阻尼模型的标准测试案例。分析了工程结构动力学建模过程中几种阻尼模型。通过标准测试案例的数值
高等院校自1999年实行扩招以来,大学毕业生人数连年创新高。但是,近几年,高校扩招背后隐藏的大学生不能当期就业问题日趋严重,而其中高校人才培养结构与社会需求结构失衡所引
本文根据作业车间调度问题的数学模型和特点,首先改进了经典的TS和SA算法,在此基础上提出了一套基于关键路理论的混合优化算法,实现了关键路理论和混合优化策略的有机结合;应