基于话题识别的中文邮件管理技术研究

来源 :北京邮电大学 | 被引量 : 2次 | 上传用户:simetl1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet技术的发展,各种网络应用服务越来越多,电子邮件正作为一种快捷而经济的通信手段被用户广泛使用,而由此产生的电子邮件过载就成为一个迫切要解决的问题。现有的邮件客户端提供的管理功能已经不能完全满足人们处理邮件的需求,邮件管理技术的研究也成为当前研究的一个热点。本文借鉴话题识别与跟踪领域一些思想,提出了一种基于话题识别的邮件管理方法,挖掘邮件之间的上下文关系,将属于同一个话题的邮件聚类在一起,提供给用户一个可以按话题进行排序和查找的功能,使用户能够更方便快捷地找到相关邮件。论文主要贡献及创新点如下:1.把话题识别与跟踪技术引入到邮件管理本课题的研究成果之一就是通过实验,证明了把话题识别与跟踪技术引入到邮件管理中是可行的。2.提出了一种邮件地址相似度计算方法和一种邮件标题相似度计算方法通过分析邮件文本自身所具有的一些特性,提出了一种邮件地址相似度计算方法和一种邮件标题相似度计算方法,并分别通过实验与现有的方法做了比较,实验证明本文提出的这两种计算方法的表现性能都优于原先的方法。同时,对于正文相似度的计算也采用了两种不同的计算方式,我们通过比较实验选出了其中表现较好正文相似度计算方式。在话题识别的相似度计算中结合了邮件的标题相似度和地址相似度,实验表明改进的相似度计算方法比单纯使用文本相似度计算方法有一定的提高。3.制作了一个outlook的基于话题识别的邮件管理插件模型在本课题研究的最后一个阶段,综合考虑用户的使用习惯和软件操作的简便性,完成了一个Outlook的基于话题识别的邮件管理的插件模型。
其他文献
基于胃癌基因表达数据,运用信息科学的方法和技术建立胃癌的预测模型,对胃癌的识别具有重要意义,也是当前生物信息学研究的重要课题。本文针对胃癌的预测问题,从系统科学和信
电致发光显示器件以纯固态的优点获得了全世界平板显示研发人员的青睐,它们能够在恶劣的环境中工作。其中,EL(Electroluminescent,无机电致发光显示)与OLED(Organic Light Em
数据库移植,即改变原有系统的后台数据库管理系统,并仍保持原有系统架构,数据和前后端应用程序的逻辑。这一过程通常十分庞大,它牵涉到数据库方案对象移植,数据移植,代码移植,系统测
随着世界航天技术的日益发展,世界上经济科技实力雄厚的国家都将太空看作一块资源必争之地。太空资源的争夺是一场没有硝烟的战争。航天器的发射次数和频率也随之变得更高。
声学多普勒流速剖面仪(ADCP)是根据声波的多普勒效应制成的一种精密测速仪器。以复自相关理论为基础的功率谱估计算法是ADCP设计时最常用的测频算法,但功率谱时域谱矩估计算法的相关系数需经验选取,自动化程度较低,而频域谱矩估算法计算复杂。本文以复自相关理论为基础设计了最值算法,提高了计算效率。首先,介绍了水下声波的性质以及声波的多普勒效应,给出了一维坐标下的多普勒效应公式。建立了声波的发射与接收数学
多源数据融合是针对使用多个或多类传感器的系统这一特定问题而开展的一种信息处理新方法。运用多源数据融合方法得到的遥感影像数据具有冗余性、互补性、合作性,能根据不同的应用需要提供出在时间分辨率、空间分辨率、光谱分辨率要求不同的多源融合数据。本文针对中巴资源卫星02B卫星的CCD、HR数据,以像素级图像融合为研究重点,主要完成了以下的工作:(1)在总结国内外遥感图像融合的研究现状上,得出了现阶段遥感图像
目前,由我国担任发射的航天器大部分都带有挠性附件,挠性附件正朝着结构和体积更加复杂的趋势发展,对这类航天器的控制要求也将变的更加严格。基于此趋势,我们所使用的控制算
基于互信息的图像配准方法直接利用图像的灰度信息,不需要对图像进行分割等预处理,有鲁棒性好、自动化等优点,本文对基于互信息的图像配准进行了研究。首先介绍了主要图像配
随着工业CT技术的发展,工业CT的应用领域越来越广泛,它在一些新兴应用领域正发挥着越来越重要的作用,同时,新兴应用领域对工业CT系统提出了更高的要求,即要求工业CT的精度更
在现代企业物流运作中,仓储运作效率是整个物流管理过程的核心环节。因此,应用新的信息技术产品提高仓储管理各个环节的工作效率成为提高企业运营效率、降低成本、提升客户满