基于概念的文本表示模型

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:sswei1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本信息处理正朝着语义的方向发展,而当今主流的文本表示模型——向量空间模型(VSM)以单个词语作为特征项,这忽略了自然语言中词语之间的语义联系、导致文本中大量存在同义词与多义词现象,从而严重地降低了文本信息处理的精度。应用自然语言处理相关技术和成果,把概念和概念距离引入向量空间模型,从语义、概念的角度出发,以概念作为文本的特征项,建立基于概念的文本表示模型。实验证明:这种方法能较好地解决同义词和多义词问题、提高了文本分类的查全率和查准率。
其他文献
山东省科学院激光研究所山东科力光电技术有限公司历经5年刻苦攻关,耗资数百万元研制的T4系列安全光幕产品成功通过了国际权威认证机构TUV南德公司的TUV认证(证书编号NO.Z10130
基于步态的身份识别是近几年出现的一种新的生物识别技术。提出了一种融合静态特征与动态特征的步态识别方法,该算法使用小波矩描述步态序列图像的静态特征,接着使用主元分析法对小波矩进行降维,而图像的动态特征则用人体轮廓的3个宽度特征来描述。最后,通过实验证明了该算法的有效性。
本文就花生肽对小鼠的抗运动性疲劳作用进行了研究。动物耐力实验中,与空白对照组相比,花生肽组能增加小鼠耐力实验中的负重游泳时间,降低生化指标中的血乳酸和尿素氮的水平,提高
用扫描电子显微镜,对秋海棠属3种植物的花粉形态进行了观察研究。结果显示:花粉粒均为超长球形,具三孔沟,条纹状雕纹。花粉粒大小和外壁雕纹种间差异显著。
数字水印技术是视频版权保护的一种重要方法。研究了一种新的鲁棒型视频水印算法,水印嵌入时,对原始视频亮度分量的帧图像整体做DCT变换,将扩频序列叠加在其低频系数段上。水
加强植物生物学实践教学改革,培养应用型创新人才,是植物生物学课程的培养目标.通过规范实验教学、整合实验内容、发挥教学基地功能、规范实习实训大纲、建立第二课堂、科研促进
结合实际,重点介绍了输电线路施工中存在的问题。并进一步阐述了输电线路施工的管理措施与技术措施。
美国作为世界上最大的文化教育输出国,其高等教育对许多国家都产生了深刻影响。美国高等教育也是通过移植他国高等教育模式而发展起来的,但美国并没有完全照搬他国经验,而是在结
基于目前遗传学实验教材一般存在背景知识介绍过于简单且陈旧、操作指导介绍过于笼统等不足,杨大祥在《遗传学实验》编写和修订时作了一些创新:注重实验背景知识、研究思路的介
新建立的本科院校的教学活动中,在任课教师、教学态度、教学课件、学生作业、学生质量、匆忙设置新专业等方面存在问题,导致了教学质量的下滑,影响了院校的进一步发展和壮大