User Oriented Semi-supervised Document Clustering

来源 :第23届过程控制会议 | 被引量 : 0次 | 上传用户:fenglu84
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
In many text mining applications, it is needed to cluster documents according to demand of users. However, Traditional documents clustering that use unsupervised learning are not able to meet this demand. In this paper, a new clustering approach that focuses on the problem is proposed. Main contributions include: (1) Expresses user requirement by topic with multiple attributes (2) Annotates topic semantic by ontology, calculate dissimilarity between topic semantics and build dissimilarity matrix. Experiments show that new approach is effective.
其他文献
建立了一个具有四自由度的力学模型,利用多自由度系统振动的理论,分析了典型风荷载对小麦的影响,推导出小麦的倒伏弯矩计算公式,考虑土壤特性、小麦根须分布情况,在郎肯土压力理论
会议
  本文首先简要介绍了微分方程的不变性条件, 以及偏微分方程无穷小生成元的延拓变换, 然后分析了如何利用分布参数系统无穷小生成元,求解符合边界条件控制律的过程。 对于描
  文章阐述了一种基于贝叶斯方法的模型移植技术,通过模型迁移函数和最优实验产生的数据来建立复杂且相似过程的经验模型。模型移植充分利用了过程的相似特性和原有的旧过程
近些年来,建筑行业得到了高效的发展,在建筑行业中,成本控制是非常重要的环节,成本控制的重点内容则是预结算审核环节,只有把工程造价预结算审核的工作做好,才能够把成本从根
随着城市的快速发展,每年所产生的污水排放量越来越多,这也导致城市河流污染问题加剧.经过长时间的发展,河流基本上都是通过人工参与的方式进行改善、修复以及改造等,河流本
  为了提高风力发电的效率,本文对含有风电场的电力系统的调度优化进行了进一步研究,首先建立了调度模型,然后把萤火虫算法进行改进,加入了粒子群算法的全局最优解的思想,然后应
  为德国卡尔迈耶双针床经编机开发了多速电子送经系统。采用嵌入式工控机和高性能单片机分别作为主从控制器的设计方案。在深入研究多速电子送经原理的基础上,详细给出了系
摘 要:新课改以来,新模式、新形式的教学活动相继出现,将不同教学形式相互融合的模式应运而生。在小学阶段的素质教育中,语文教学离不开课外阅读,其作用和价值在于提高小学生的阅读经验和知识水平,并通过阅读的方式增长见识,掌握素材,为之后的语文学习和写作助力。可以说,正是因为课外阅读的存在,才使小学语文教学模式更加规范,教学工作的开展也更加顺利。将课外阅读与作文教学相融合,以课外阅读中的知识为写作提供素材
  在德士古水煤浆气化工艺中,合成气中各组分的含量是衡量气化效率的关键参数。以某厂德士古气化装置为研究背景,设计了一种合成气组分含量的预测模型。该模型选取三层前馈神
会议
中职教育中的思想政治教育对学生有着很大的影响,而思想政治教育中的人文教育也能够影响到学生思想政治意识和人文素质观念的发展.为此,中职教师需要注重思想政治教育和人文