基于改进Rocchio算法的短文本自动分类研究

来源 :中原工学院学报 | 被引量 : 0次 | 上传用户:waq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了利用已有的分类方法对短文本信息进行分类,选取大量长文本作为训练集,以此形成“词典”,并利用改进的简单向量距离算法实现分类.理论和实验结果表明,该方法非常适用于短文本信息的分类.
其他文献
松辽盆地北部徐家围子断陷深层地质条件复杂,虽然常规叠后时间偏移处理的成果,能够识别区域构造与火山岩的复合发育区基本轮廓,但陡倾角地层的反射成像不清晰,火山岩地层边界模糊
通过问卷形式对中原工学院双学位教学基本情况和满意度进行调查分析.结果表明:大学生攻读双学位的原因主要是为了提升自身的竞争力;学生在双学位学习中遇到的困难主要是没有
根据齿轮类零件加工工艺的要求,利用Visual C++6.0软件及Access数据库开发了一种齿轮加工工艺数据库管理系统.该系统是齿轮类零件CAPP系统的一部分,它能够方便地实现齿轮相关参
在凝析气井近井地带,由于高速流动使得凝析气液相变呈现非平衡特征,对凝析液聚集及产能均会产生影响。基于已有凝析气非平衡相变的研究成果,建立非平衡相变非线形模型,考虑了最小