决策树在中文姓名信息提取中的应用研究

来源 :成都信息工程学院学报 | 被引量 : 0次 | 上传用户:sxsdlyq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出并实现了一种中文姓名信息提取方法,该方法首先根据姓氏和名的用字概率信息,将姓氏作为抽取的触发条件,在文本中初步提取姓名。然后再充分利用中文姓名的上下文信息及姓名用字之间的关联程度的信息,选取特征作为决策树测试的属性列表,并将初步提取出来的姓名是否是真实姓名(bool型的值:yes或no)作为决策树要预测的目标属性,组建基于ID3算法的决策树进一步提取出正确的姓名,实验结果表明,该方法具有很好的召回率和准确率。
其他文献
针对转子叉形齿周表面上多孔钻削困难的问题,设计了两套专用钻模,介绍了转子叉形齿叶根销孔加工用钻模的设计方法及制造要点。
从全球规模(EM0)来看,复合化车床、卧式车床以及五轴综合加工机等3类机床在欧洲市场身价看涨,成为欧洲市场需求的主要机床品种。
根据生产中存在的磨削裂纹问题,通过温度场计算,找出了形成裂纹的主要原因,并采取相应的工艺措施,使问题得到解决。文中详细介绍了温度场计算和分析过程。
采用CFD软件中的商业软件fluent 6.122分别对直切单/双进口旋风分离器进行数值模拟。采用拉格朗日模型对固相颗粒的轨迹进行了模拟,表明颗粒避口位置对颗粒的轨迹有较大影响。
介绍了模糊控制中的设计思想及方法,并采用模糊控制的方法来改进实际生产中PID控制的一些控制难点。将改进方法应用在一大型水压机控制系统中并在实际生产中取得了理想效果。
提出的基于AOP的Token算法,将Token处理过程作为AOP的一个方面(Aspect)抽取出来,能在较大程度上减少Token处理代码的冗余度,使Action模块具有较好的可移植性,使系统结构更清晰,
建立法兰密封中螺栓与螺栓孔的传热学模型,将辐射换热、对流换热、导热转化为螺栓与螺栓孔间空气层的当量导热,计算了不同规格螺栓在不同温度下的当量导热系数,结果表明,对所有规
阐述了西门子802D数控系统在机床数控技术改造应用中的具体设计思想和实现方法。
结合气象业务专用网络的特点以及自动气象探测设备的通信方式,提出在网络基础上解决中心业务系统与远程各种气象探测设备直接进行数据交换的问题.在解决方案中采用软件代理的
<正>~~
期刊