基于互信息可信度的特征选择方法

来源 :第十一届全国青年通信学术会议 | 被引量 : 0次 | 上传用户:victor530505911
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在自动文本分类系统中,特征选择是有效降低文本向量维数的一种方法.本文在分析了常用的一些特征选择的评价函数的基础上,引入可信度的概念,提出了基于互信息可信度的特征选择方法.实验证明这一方法简单可行,有助于以提高所选特征子集的有效性.
其他文献
利用PCR扩增出猪繁殖与呼吸综合征病毒的GP3与GP4基因,按正确的读码框与GP5基因单独或同时串联,成功构建穿梭载体pShuttle-CMV-GP3-GP5、pShuttle-CMV-GP4-GP5、pShuttle-CMV
会议
目的:测定新Caspase抑制剂F1013的血浆蛋白结合率.方法:采用超滤法和高效液相色谱法测定F1013的血浆蛋白结合率.结果:F1013与Wistar大鼠血浆和正常人血浆的蛋白结合率分别为(
通讯和计算机网络的高速发展,使基于电话与网络的物流系统越来越普及.研究开发基于短信的电话客户管理软件,通过座机的来电显示,自动调出具有相同电话号码的客户信息并生成订
文章首先针对我国企业现阶段发展电子商务所面临的问题作了分析,进而提出了构建统一的电子商务综合服务平台的必要性,并对基于XML的电子商务综合服务平台的实现方案作了研究,
编輯同志: 最近有好些篇文章在讨论中国资本主义萌芽这問題,这是一个值得深入研究的问题。有些人肯定地说中國在明清之际已經有了資本主义的萌芽。另外一些人以为文献無征还不能肯定。我覺得根据現在这些材料來肯定,已有资本主义萌芽确乎是太早一些;因为文献无征而不作肯定,虽然是比較科学的,但并不能解决问題。在討論中,大家談到南京、苏州、杭州的織造問題,但究竟这三个地方的絲织業是官府工业或是民間的手工業工場还是不明白。我是苏州人,我知道一些。在前清末年,我还是个小孩,苏州家庭就有
文本聚类是目前文本挖掘中重要的探索性数据分析方法.一篇文档仅属于某个主题,是很不现实的,所以模糊文本聚类比一般的硬文本聚类更科学.本文借助于非负矩阵分解算法,提出了
目前多种不同构件模型的并存,导致了构件间互操作困难.本文针对不同构件的构件模型,结合XML技术的特点,定义了一种构件互操作描述语言CIDL(Component Interactive Descriptio
本文介绍了一种从统一建模语言(UML)到规范说明和描述语言(SDL)的转化方法及规则,并以一个ATM(Automatic Teller Machine)系统为例来介绍具体的转化过程.在本方法中,通过对目
在研发和申报对化学性肝损伤有保护作用的药物以及有辅助保护功能的保健食品时,常采用实验大鼠或小鼠的四氯化碳(CCl_4)肝损伤模型作为检验方法。目前,对化学性肝损伤有辅助
利奈唑胺是首个应用于临床的噁唑烷酮类合成抗生素,其通过抑制蛋白起始复合物的形成从而抑制细菌蛋白质合成,与其他类抗生素的抗菌作用机制不同。利奈唑胺在体内外对金黄色葡