支持向量机的文本自动分类研究

来源 :第四届全国搜索引擎和网上信息挖掘学术研讨会(SEWM2006) | 被引量 : 0次 | 上传用户:heroszk2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过试验表明支持向量机比K-最邻近法具有更好的分类能力,而且不同特征选择方法对支持向量机的影响要小于K-最邻近法.通过对支持向量机的特征的选择实验,表明一般应用CHI统计进行特征选择的分类精度最高.上述结果可帮助人们认识和正确使用支持向量机进行文本分类.
其他文献
本文简要介绍了HACCP的原则和应用现状.对HACCP在食品冷藏链中的运用作了初步的探索,并介绍了利用TTI技术监控流通过程中冷藏食品的品质.
当今世界随着科学技术与人类文明的飞速发展,食品安全已引起社会公众的空前关注,预防与控制从食品生产原料、加工到贮运、销售等全过程可能存在的危害,最大限度降低风险,已成为现代食品行业追求的核心管理目标.HACCP作为一种控制食品安全的管理体系,将极大地加速冷藏企业冷冻食品的安全体系、安全标准的建立,促进食品冷藏链的完善.
分析了当前个性化服务的需求以及现存系统中的主要缺陷,以此为借鉴设计并开发了个性化URL评价系统.系统利用显式模式和隐式模式相结合的方法收集分析用户访问Web资源的行为特征和资源本身,建立和更新提出的用户兴趣URL库,然后在此基础上依据相应算法提供个性化服务.实验结果表明,系统有效地提供了搜索引擎检索结果的重排序和未浏览网页的兴趣度评价服务,在服务速度以及准确性方面都有着很好的表现.
数据挖掘已经成为提升行业竞争力的重要的信息技术,它综合运用机器学习以及信息科学的理论与技术,挖掘隐藏大量数据背后的模式与知识,为业务决策提供有意义的参考信息.目前仍存在许多遗留的信息系统,其中大量的业务规则是以自然语言描述的形式存储在数据库中的.在这类遗留系统上进行数据挖掘,就必须解决如何从这些不规则的自然语言描述中抽取信息的问题.我们讨论了如何从自然文本中抽取业务规则,为了将这些信息存储在多维数
提出了一种全新的文本与多媒体检索方法,既可实现各种对象的混合检索,又能实现对象的分类检索;可以检索中文字、词、英文文字、音频、视频和图像等各种对象,并能检索到不同层次上的对象,如一部视频,一个剪辑,或者是一帧视频;对于文字对象,可以实现字符一级,词一级,句子一级等的检索;还可以准确地检索多音字或者含有多音字的词.由于各种对象都采用编码方式存储,各种对象的组织、索引简单,能节省存储空间,检索速度快,
如何从相似服务中发现最优服务是Web服务研究中的一个重要问题.现有的Web服务发现方法大都没有有效利用系统积累的用户相关反馈.为了进一步提高Web服务发现的性能,提出了一种基于相关反馈日志在线分析的Web服务发现方法.该方法在语义的支持下,将用户的服务查询条件与反馈信息关联起来,合理的组织成反馈数据库,利用反馈数据库的信息,结合服务质量,查找最优服务.
应用面向对象的方法,将人工智能中的推理策略进行对象化,提出了统一的推理策略模型,目的是提高推理策略的应用范围和代码的重用性,降低推理策略维护的复杂度.此外在推理过程中加入操作阈值的概念和策略搜索的思想,对推理步数进行控制,对缓解时间复杂度和真值解精确度的矛盾问题上做了一些尝试.
互联网飞速发展的同时,由不良信息引起的互联网内容安全问题越来越引起人们的关注.对面向互联网的内容安全的研究进行了综述,分别从研究主题和支撑技术两个侧面讨论了目前用于内容安全的应用领域、路线方法和研究进展,并对今后的研究进行了展望.希望本文能对内容安全技术和系统的研究开发提供参考.
尝试使用Petri网进行简单的手语词汇识别.采用模板匹配方法检测到一系列简单的手势,如:手掌张开直立、握拳、伸出大小拇指.其中每个简单手势的发生对应于Petri网中的一个变迁.待识别的手语词汇是由一串特定的手势序列构成的,如:手掌张开直立-握拳-伸出大小拇指.通过Petri网记录手势的动态变化,并在每次新变迁发生时检测目标库所的标志增加情况,从而实现特定手语词汇的识别.
探讨了一种基于构件技术的信息系统的开发方法,详细论述了构件设计的思想,给出了基于构件技术的信息系统的开发模型和开发的具体步骤,并据此模型设计实现了消防文书管理子系统,证明了利用构件技术开发信息系统是高质、高效的.