【摘 要】
:
提出一种将话题聚类算法应用到计算热词关联度上的方法。在热词发现阶段,通过对新闻文本的特征提取,构建向量空间模型,采用初始聚类中心优化的K-means算法,获取热点簇;在关联
【基金项目】
:
湖南省哲学社会科学基金(No.14YBA335)
论文部分内容阅读
提出一种将话题聚类算法应用到计算热词关联度上的方法。在热词发现阶段,通过对新闻文本的特征提取,构建向量空间模型,采用初始聚类中心优化的K-means算法,获取热点簇;在关联分析阶段,先通过热点簇计算词类别距离,再和新闻同现率,热词同现率加权累加,得到热词关联度。该方法已成功应用到南华大学舆情监测系统中,并在实际运行中获得较好的效果。
其他文献
人体从头到脚都存在着"左右法则",了解它,对我们的健康起着重要作用。耳朵:左耳听力好,右耳记话牢。美国加利福尼亚州立大学研究院思宁格发现,人的左右耳各有分工,左耳擅长辨
伴随我国造林事业的不断发展。植树造林已成为当前造林生产的主线路。从宏观角度来说,植树造林并不是一项简单的种植活动,其种植的前提是促进森林产业实现可持续发展,这意味着植
一、加强宣传,营造管理相对人自觉履行法律义务的良好氛围。 通过印发宣传资料、编发短信、电视台、巡回各镇办现场宣讲等形式对((动物防疫法》等相关法律法规进行全方位宣传。
XBRL作为一种基于XML的可扩展性商业报告语言,目前已广泛应用于财务系统中。因企业财务数据越来越多,利用数据挖掘方法挖掘出我们需要的信息显得极为重要。实现一种面向XBRL
据报道,日本三重县一家有机肥料销售公司用中药废渣做肥料取得成功。
在湖北省襄阳市南湖广场一条比较清静的街道上,挤满了一家家商店,其中有一家名为“雅馨绣纺”的十字绣商店。一走进店门,就能感受到一种安静、温馨的氛围。店的右侧墙壁上挂着一
在模糊查询条件下,针对同一关系中的不同属性的取值的差异性造成查询结果不准确的问题,通过方差压缩的思想对原数据进行标准化处理后再进行模糊查询,并进行实例验证。
休息休假是劳动者的基本权利之一,我国现行的休假制度所包含的假期主要有法定节假日、部分公民放假的节日及纪念日、婚假、丧假、产假、探亲假、年休假、病假等。这里所列的假
猪棘头虫病是由猪棘头虫寄生在猪小肠内所引起的寄生虫病。本病分布广泛,常呈地方性流行,严重影响猪的正常生长发育,甚至造成死亡。
她没有名字,我们都叫她阿妹。在她10岁那年,医生就说她活不满20岁,她智障,行为迟钝,而且老化迅速。她与我同龄,是我丈夫的一个远房亲戚,一听说有人结婚,她就会急急忙忙跑过去