半监督语义动态文本聚类算法

来源 :电子科技大学学报 | 被引量 : 0次 | 上传用户:wstpxx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统的动态文本聚类将描述方式不同的同类文本划分到不同组中;以及聚类类别个数与真实类别数之间差距明显等问题,该文提出了一种半监督语义动态文本聚类算法(SDCS).该算法以语义表征文本的方式来捕获文本间的语义关系,在聚类过程中动态学习类别语义,让文本能根据语义准确聚类.同时该算法利用半监督聚类的方法对新类的产生进行监督,学习符合实际情况的聚类结果.实验结果表明该文提出的算法是有效可行的.
其他文献
针对涠洲原油高含蜡特性,比较了室内合成的长链不饱和羧酸酯类降凝剂HYJ-08与市售7种降凝剂降凝效果,并探讨了影响加剂效果的因素。实验结果表明,涠洲原油最佳热处理温度为55
以粉煤灰和硝酸铁为原料制备了粉煤灰/水合氧化铁复合吸附剂。通过扫描电子显微镜(SEM)对吸附剂进行微观形貌观察,采用静态吸附实验方法,分别用碱处理过的粉煤灰和粉煤灰/水合氧化
发达国家家族制企业与中国家族制企业在管理模式和企业绩效等方面存在巨大差距.差距产生的根源是中国家族制企业不具备现代良好的企业文化.中国的家族制企业文化的建立必须与
目的为满足医教协同深化临床医学人才培养改革要求,提升中医临床类别研究生的理论知识水平与中医辨证论治能力,拟对《中医临床基础》课程教学进行改革。方法采用问卷调查方法
新课改指出,初中体育教学要提高学生的体魄,锻炼学生的综合素质,培养学生的体育核心素养.因此,教师要积极构建初中体育高效课堂,以促进学生德智体美劳全面发展为目标,不仅要
分析宣威市土地石漠化的成因主要为地质、气候等自然因素以及陆地开垦、过度樵采等人为原因.根据石漠杞土地具有的区域性特征,提出了分区治理的基本思路及针对不同治理区的具体
为了解决深水远岸独立基床测量控制的难题,达到高的施工精度要求(±5cm),比较施工测量控制的多种方法,得出采用GPS+双频测深仪测量控制法和测量导尺测量控制法相结合进行本工程的基床施工。通过计算及精度分析发现,该方法能够满足基床定位精度,测量导尺测量控制法能进行基床整平高程(质量)控制。深水防波堤基床的施工测量实践表明:TC2002全站仪精度高、性能稳定,自制测量导尺方便、实用性高。
介绍山东省龙口市黄水河湿地地理位置、水源、生物多样性、景观文化资源等概况。分析认为,黄水河湿地当前存在的主要问题是客水补给逐年减少,工农业生产对地下水源过量开采造成
采用实地调查和3S技术相结合的方法,对曼稿保护区社区土地利用方式进行了调查、统计和分析,得出了曼稿自然保护区社区土地利用状况及利用方式的数据。分析其对保护区内自然资源
随着制造工艺进入65 nm节点,闪存的可靠性问题也越来越突出,其中闪存芯片擦除速度随着擦写循环的增加出现明显退化。该文从单个存储器件的擦写退化特性入手,详细讨论了隧穿氧