基于内容相似性的文本集主题描述模型

来源 :中国人工智能学会第12届全国学术年会 | 被引量 : 0次 | 上传用户:szm2009szm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了实现基于内容的文本集主题描述,本研究提出了一种新的文本集表示模型。该方法将文本中项的频率、项的共现频率以及它们在文本集中的分布情况有机结合,构造了一种新的文本内容相似度度量方法,并给出了该方法在真实文本数据集TanCorpV1.0上的实验结果。
其他文献
近年来,主观性文本(意见)挖掘研究十分活跃,主要特点是分析文本中包含的主观观点并计算其语义极性。这类研究可广泛应用于信息过滤、智能电子商务、意见反馈、民意调查等。词
文本倾向识别在邮件过滤、语义理解和信息安全等方面有着广泛的应用。传统的基于统计的倾向判断忽略了语义对于语序的约束,因此效果不理想。本文结合已有技术,针对短信的倾向
近年来随着情感信息处理的研究不断深入,语音信号中的情感转换的研究越来越受到人们的重视。本文首先探讨了情感的分类、建模,接着将语音情感转换系统分为特征提取、参数转换
辽东省辽原市立医院,由于卫生科罗铭科长的正确领导,将原市立中医院合并在市立医院一起成立市立医院的「中医部」下设三科(一)内妇科、(二)小儿科、(三)外科,每一科室医生二
语义角色标注是为句子中谓词论元及附属成分标上其担任的语义角色,如施事、受事、时间和地点等等。汉语语义角色标注的研究才刚刚起步,可利用的资源还很有限。本文采用半监督
随着网络信息资源迅速增加,如何及时准确地获取所需的信息,是现代网络信息过滤技术需要解决的主要问题。本研究针对经常在某个领域检索的用户需求,利用元搜索的理论及优势,完
会议
在建筑师勒·柯布西耶一生的诸多旅行中,一次名为“东方之旅”的旅行,日后成为其最为珍视的经历.文章旨在回溯关于此次旅行的图文并构的语料库,借此探究建筑师“建筑散步”观
本研究针对汉语外国译名识别的难点,基于最大熵算法提出了一种基于规则与统计相结合的识别方法,充分考虑了外国译名的内部特征(小颗粒特征)和人名的语境信息。本文的主要贡献
会议
文本语义倾向识别是指识别某一特定主题的文本所具有的主观态度倾向性。本文基于词汇本身的语义倾向信息,提出了一种基于词汇的向量空间模型(VSM)表示算法。该算法综合利用文