中文文本分类器的设计

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:khalista8
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文分类是指在给定分类体系下,根据文本的内容自动确定文本类型的过程。文章应用球形的k-均值算法确定每个文本的类标签,并通过Boosting算法构建分类器。构建的分类器具有以下特点:分类器的设计针对未知类标签的语料库,实用性好;分类器能随着语料库中文本的变化而增加新的类,具有很好的可扩展性;分类器基于Boosting算法,具有很好的分类精度。
其他文献
随着医疗卫生信息化建设的推进.电子病案已经在医疗系统中广泛开展。电子病案(EMR,Electronic Medical Record)也叫计算机化的病案系统或称基于计算机的病人记录(CPR,Computer—Bas
通过调查32所乡镇卫生院及11所县区医院476名医务人员,发现其艾滋病职业暴露防护相关法律认知正确率不高.对皮肤及黏膜发生暴露后的局部处理、防护血液体液飞溅面部的措施、职
针对目前许多工作流产品协作性弱的实际问题,提出了将消息传递应用在基于Web的工作流系统的模型。文中首先介绍了工作流的基本概念,产品分类及发展趋势;然后分析了基于Web的工作
经济学分析对象是一般经济行为,而医疗卫生经济是特殊经济现象。医疗卫生经济的特殊性表现在其行为的社会价值目标与一般经济不一样,交易特征与一般经济不一样。医疗卫生的社
文章研究了不同视点下图象平面投影的坐标关系。给出了摄像机旋转和平移运动产生的序列图象间的匹配公式,提出了运动序列图象的整合方法,该方法有以下优点:整合图象满足透视几何
六安市两所公立医院自2006年开始改制,组建为六安市立医院,该种医院改制模式在管办分离的实践上有所突破.盘活了当地卫生服务资源.保留了公立医院的功能和职责,提升了医疗技术水平
该文在分析机械设计领域知识的特点的基础之上,提出了机械设计领域知识的表示模式以及含有元知识的二级推理模型和冲突消解策略。