【摘 要】
:
如何挖掘存储在手机上的大量短信息背后所隐含的会话信息,是一个非常具有挑战性的问题,因为它们并不具备"主题"、"回复"等经常被用于邮件线索分析的元数据.基于此,提出了一种
【机 构】
:
网络与交换国家重点实验室(北京邮电大学),诺基亚研究院,无锡物联网产业研究院
论文部分内容阅读
如何挖掘存储在手机上的大量短信息背后所隐含的会话信息,是一个非常具有挑战性的问题,因为它们并不具备"主题"、"回复"等经常被用于邮件线索分析的元数据.基于此,提出了一种基于时间聚类算法和话题检测的短信息会话识别模型.首先,根据短信息流的时间分布特性,将会话双方的所有短信息划分到一个一个的候选会话中,进而运用基于latent Dirichlet allocation(LDA)训练出来的语义话题模型,对候选会话进行更深层次的分析;利用该话题模型度量了各个候选会话在话题上的相关度.最后,在综合时间和话题相关度的基础上,通过对候选会话的合并识别出隐含的会话信息.通过对包含了50名大学生在6个月中产生的122 359条短信进行实验验证,证明了该算法的有效性.
其他文献
通过统计红河州46年降雨资料,研究分析旬、月、季、年降雨量空间分布特征,结果表明:红河州5月降雨量、5~10月降雨量、年降雨量及11~4月降雨量的空间分布都存在从西南到东北呈多
近年来,"时间银行"这一循环互助的新模式也在我国一些社区得到了广泛开展。本文简要介绍了"时间银行"的源起,分析其开展的必要性,并结合我国社区管理发展的实际情况,探讨实行
<正>积极稳妥地推进城镇化建设,既是我国转变经济发展方式,实现社会主义现代化的重大战略任务,也是当前稳定经济增长,扩大有效需求的现实选择。当前,大庆市正处于转型发展关
介绍了群落水平多度格局与物种水平多度格局,概述了国内群落多度格局应用研究状况。其中节肢动物群落多度格局研究最为丰富,许多学者利用节肢动物群落物种多度格局对栖境质量
中华文明体系价值现的核心可以用“和谐“来概括。以家族血缘关系为纽带的生产组织形式,依靠协作性生产进入农耕文明,促进了中国先民和谐价值观的产生;以血缘、氏族为纽带,社会组
专利技术许可中的不质疑条款可能掩盖了无效专利的存在,使得被许可人为无效专利支出了不合理的许可费,并可能产生阻碍技术市场竞争和创新的后果,但不质疑条款的存在也可能产
《秋颂》是约翰·济慈最著名的抒情诗之一。诗人生动地描述了秋天,即雾和成熟结果的季节,还表达了作者对收割过的田野的羡慕情感及那种对宁静与温暖景象的渴望。这首短短的抒
当代艺术欣赏与艺术创作中描摹制作化倾向越来越明显。研究梳理中国古代"书画同源"理论产生的条件与历史背景,对于提高当今人们文化审美和指导艺术创作有着一定的现实意义。
分析和比较了綦江、一品河和嘉陵江的水体和水体沉积物中2种重金属(铅和镉)和3种有机物(五氯酚、六六六和甲基对硫磷)的质量浓度差异,并基于重金属铅、镉及有机物五氯酚、六
农民问题在我国一直是为社会各界所关注的重大问题,原因有很多,首先是我国农村人口占我国人口的绝大多数,与农民相关的各种经济社会问题对我国整体国民经济和社会发展起到的至关