搜索筛选:
搜索耗时5.3811秒,为你在为你在102,285,761篇论文里面共找到 5 篇相符的论文内容
类      型:
[学位论文] 作者:林洋港,, 来源: 年份:2009
数据偏斜和噪声数据是文本自动分类应用中经常遇到的问题。在数据偏斜的情况下,样本无法准确反映整个空间的数据分布,分类器容易受到大类的影响而忽略小类。大多数分类算法都...
[期刊论文] 作者:林洋港, 来源:统一论坛 年份:2001
日本舆论界总喜欢把2300万台湾人民分为“本省人”和“外省人”,并以此来理解台湾的现状和未来。这个划分法很不正确。所谓“本省人”、大陆人(即所谓“外省人”),除了百分之二......
[期刊论文] 作者:林洋港,陈恩红, 来源:计算机工程与科学 年份:2010
训练集中文本质量的好坏直接决定着文本分类的结果。实际应用中训练集的构建不可避免地会产生噪声样本,从而影响文本分类方法的实际应用效果。为此,针对文本分类中的噪声问题,本......
[期刊论文] 作者:施德明,林洋港,陈恩红, 来源:计算机工程与科学 年份:2007
文本分类是将自由文本自动划分到若干预先定义类别的方法,在信息检索等领域有很重要的作用。其中,如何选择有效的文本特征是影响文本分类器分类性能的一个重要步骤。很多应用中......
[期刊论文] 作者:权小军,林洋港,罗奇鸣,陈恩红, 来源:中国科学技术大学学报 年份:2009
概率主题模型是一种统计生成模型,它从文档集合中抽取一系列主题,并将这些文档表示为不同主题依照一定概率混合而成.通过这种模型发现的主题,能揭示文档的语义信息,在很多领域都有......
相关搜索: