【摘 要】
:
基于向量空间模型的分类方法是目前各种分类方法广泛使用的文档结构表示方法,在对基于向量空间模型的分类方法的研究发现,基于向量空间模型的分类方法存在不合理之处,即特征值之
【机 构】
:
中国科学院计算技术研究所,北京,10080
论文部分内容阅读
基于向量空间模型的分类方法是目前各种分类方法广泛使用的文档结构表示方法,在对基于向量空间模型的分类方法的研究发现,基于向量空间模型的分类方法存在不合理之处,即特征值之间的“鸿沟”,这种鸿沟会导致向量空间模型中两点之间的距离的计算出现偏差,本文介绍了一种使用虚点的方法,这种方法消除了特征值之间的鸿沟,使得分类的效果得到了提高。该方法是通过重新定义特征权重,调整向量空间模型中点的特征值,即相当于重新定义向量空间中的点,这样的点是相对于原来向量空间模型中的点的矫正映射,即就好像是虚拟点一样,最后问题归结为计算向量空间模型中的点与虚拟点的映射函数。理论分析表明虚点方法能提高基于向量空间模型的分类方法的效果,在SVM中运用虚点方法的实验结果表明,运用虚点方法的SVM的精确度得到了提高,这种结果验证了本文提出的虚点方法的有效性。
其他文献
党支部是党的基层组织,是党的自身建设和管理的最基本单位,是党在企业基层组织中的战斗堡垒,是党联系群众的纽带和桥梁,是群众了解党、认识党的窗口,是团结带领干部职工努力
说到于是之,我要和大家交代一个鲜为人知的细节,老舍写给于是之的条幅“努力如是之者,成功其庶几乎?”当年交到他手里以后,他一声不吭,既没有向旁人显露此事,更没有裱起来张
近些年,随着我国市场经济整体环境的繁荣,更多新兴行业应运而生,证券公司正是在这样的大背景下逐渐成长起来的.全社会在进入人工智能时代之后,证券公司需要面对更多的机遇与
分面导航是用户基于多维分类目录检索和浏览资源的主要方式之一。通过推荐与当前搜索结果相关的类别,帮助用户理解搜索结果,并有效避免查询结果为空。然而,目前的分面导航难以分
共指消解是自然语言处理的核心任务之一。在传统机器学习方法使用的平面特征基础上,本文提出一种利用中心语信息的新方法。该方法首先引进一种基于简单平面特征的实例匹配算法
尽管搜索引擎能够满足网络用户的很多信息需求,但是还有很多它无法满足。原因之一是它严格的用户界面:它的输入是
①ERα是子宫内膜样腺癌的优势受体,在本病发生中起促进作用;ERβ和PR在子宫内膜样腺癌发生中可能起到一定的抑制作用。②ERα在子宫内膜样腺癌的发展中出现改变,可能仅在该病初
排球运动与运动员的整体的肌肉力量,以及运动员自身的体能有直接的关系,根据排球的运动特点,本文将解析排球训练中,核心力量训练的必要性价值以及应用性价值,确保运动员的身
【摘 要】搭设门洞是上跨既有铁路线路施工的重要手段,现以南宁市沙井-富乐立交桥10#-11#桥墩上跨沙井铁路货运专用线搭设门洞为例,简要介绍门洞支架搭设现浇连续箱梁施工工艺,以此为类似工程施工提供参考。 【关键词】现浇箱梁;上跨铁路;贝雷梁;支架 1.工程概况 沙井-富乐立交桥位于南宁市江南区,沙井大道与富乐路交叉处,立交形式为两层的半边变形的苜蓿叶互通式立交。设计为富乐路上跨既有沙井大道,
查询日志中的同现搜索词可以通过复杂网络进行刻画。本文基于Sougou 用户查询日志语料,建立了搜索词的同现网络。由于搜索词中包含了大量的人名,同样也存在着人物搜索词同现网