搜索筛选:
搜索耗时3.0116秒,为你在为你在102,285,761篇论文里面共找到 7 篇相符的论文内容
类      型:
[学位论文] 作者:靖红芳, 来源:中国科学院计算技术研究所 年份:2009
文本分类是数据挖掘、机器学习中的一项基本技术。文本分类中通常要把文本表示成多维特征构成的向量。原始的特征空间维数通常很高,不仅会导致分类的效率低下,而且由于噪音特征......
[会议论文] 作者:靖红芳,王斌,杨雅辉, 来源:第四届全国信息检索与内容安全学术会议 年份:2008
极高的特征维数使文本分类变得复杂和费时,为此非常需要有效的特征降维方法.目前已有很多种特征选择方法,但据我们所知,没有一种独立的特征选择方法能够在非平衡语料上取得很好的效果.本文依据特征在类别间的分布特点提出了基于类别分布的特征选择框架.该框架能......
[期刊论文] 作者:张爱华,靖红芳,王斌,徐燕, 来源:中文信息学报 年份:2010
在传统的基于向量空间的文本分类中,特征权重计算与特征选择过程完全割裂,特征选择函数的得分能反映特征的重要性,却未被纳入权重表示,造成特征表示不精确并影响分类性能。一些改......
[期刊论文] 作者:靖红芳, 王斌, 杨雅辉, 徐燕,, 来源:计算机研究与发展 年份:2009
目前已有很多种特征选择方法,但就目前所知,没有一种方法能够在非平衡语料上取得很好的效果.依据特征在类别间的分布特点提出了基于类别分布的特征选择框架.该框架能够利用特...
[期刊论文] 作者:张磊,王斌,靖红芳,吴丽辉, 来源:第五届全国信息检索学术会议CCIR2009 年份:2009
特殊命名实体**是指字面特征不明显、与人们日常生活和休闲娱乐活动密切相关的实体名,比如电影名、餐馆名、大学名以及人名等等。在以娱乐为主的中文搜索中,这些命名实体占据重要地位,对它们进行挖掘不仅能够形成一种重要的数据资源,给互联网上的信息抽取提供基础,还......
[会议论文] 作者:张爱华[1]靖红芳[1]王斌[1]徐燕[2], 来源:第五届全国信息检索学术会议CCIR2009 年份:2009
在文本分类任务中,通常首先以TFIDF模型表示特征权重,进而通过特征选择函数给出的得分将特征排序,排名靠前的特征以其TFIDF值输入分类器。特征选择函数所计算出来的得分能一定程......
[会议论文] 作者:张磊[1]王斌[1]靖红芳[1]吴丽辉[2], 来源:第五届全国信息检索学术会议CCIR2009 年份:2009
特殊命名实体**是指字面特征不明显、与人们日常生活和休闲娱乐活动密切相关的实体名,比如电影名、餐馆名、大学名以及人名等等。在以娱乐为主的中文搜索中,这些命名实体占据重......
相关搜索: