基于关联规则和粗糙集的话题特征提取方法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:xiewenping87
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对话题分类文本训练集少、主题相似度大的特点,提出一种基于关联规则和粗糙集的话题特征提取方法。在向量空间模型的基础上,采用挖掘关联规则的方式生成规则集与文本主体,通过调节事务主体的最小支持度与最小置信度查找不同颗粒层次的话题,利用粗糙集理论对词语特征与关联特征进行属性约简。实验结果表明,该方法能提取文本集中描述的评论主题,具有较高的话题分类准确率。
其他文献
据外媒消息,欧洲于今年9月1日起禁用卤素灯泡,结束其将近60年的照明历史,并鼓励消费者转用能源利用效率更高的LED灯泡.欧洲能源专家表示,此项转变将大幅减少欧洲碳排放量和能
发布单位:国家能源局综合司发布时间:2016年1月22日 宅窑:对核电专项资金实行课题承担单位法人负责制,法人单位是课题资金管理的责任主体,坚持资金来源多元化原则,对各渠道资金均按
针对低速率语音编码问题,提出一种基于基音预测的信息隐藏算法。在基音预测编码过程中,采用控制基音闭环搜索的自适应码本搜索范围方法,实现秘密信息的嵌入,在进行语音压缩的
舆论在微博上的传播过程可以抽象成一个生长的复杂网络。在分析微博网络特性和用户行为习惯的基础上,考虑新用户在进入网络时的同配性,建立微博关系网络的演化模型,并对模型进行
在茶叶生产中,常常要研究茶树生育与茶叶产量之间的关系,以便争取高产优质高效益。为了研究的方便,经过实践经验的总结,在理论上规定:把茶树各轮营养芽采摘后所留分枝平均产生下一
在传统CLARANS聚类算法基础上,提出一种针对不确定性目标的CLARANS聚类算法。在该算法中,待聚类的每个不确定性目标都被表示成高斯混合模型,即高斯分布的一个加权和,并将Kull
针对高铁故障数据的特点,以高速列车走行部(主要指转向架)常见故障的实测数据为研究对象,提出一种动态特征选取方法。通过结合Fisher比率和模糊熵方法对其特征空间进行评估,有效去
受北格拉斯哥学院委托,RMJM为该校设计位于斯普林地区建筑面积1.65万m2、造价达2000万英镑的教学设施,其中包括最先进的学习资源中心、会议配套设施以及设备齐全的体育馆,新
采用当前方法计算网络攻击图节点回流时,计算所用的时间较长,计算得到的节点回流与实际不符,存在计算效率低和准确率低的问题。提出基于置信度的网络攻击图节点回流建模方法,
山东省能源监管办近日印发了《山东省燃煤电厂超低排放和节能改造监管实施方案》。决定在全省范围内开展燃煤电厂超低排放和节能改造监管工作,主要监管对象包括全省30万千瓦及