论文部分内容阅读
互联网的发展越来越贴近生活、服务生活,越来越多的用户使用互联网预订预定火车票、酒店、航班等等出行服务。作为订票商会向用户发送通知邮件以确认订票的相关信息。但是用户从邮箱中查找到这些订票邮件,以及从邮件中获取信息是非常繁琐、耗时的。特别是对于出行的用户,多数时间使用手机接入互联网,在手机上操作和查找信息就变得更为不便。本文设计和开发了一个用以帮助用户整理行程的信息系统。用户只需要将来自订票商的通知邮件转发到系统指定的邮箱,系统会自动的对邮件的内容进行解析和提取。此外,系统还会帮助用户查找并添加与此次行程相关地点的天气、出行路线等信息,减少用户查询,方便用户使用,辅助用户做出决策。首先,当前系统支持火车、酒店、航班三种出行类型的邮件。通过对订票商邮件的查阅与分析,建立了分别描述这三类行程的数据模型。在此基础上,阐述了邮件的传输路径和在传输过程中邮件内容发生的变化,以及这些变化对邮件信息提取工作带来的困难,提出了将HTML转换成文本的方法解决这个问题,此方法会过滤掉邮件中会带来不统一的数据内容。再次,为了从邮件中得到数据模型中描述的数据信息,设计一种从邮件中提取出信息的方案。该方案使用正则表达式从邮件中匹配关键的数据点,并将这些数据点归纳、合并和补充成完整行程数据模型中描述的数据结构。使用该方案完成本系统中邮件信息提取的关键功能模块。最后,设计了拥有高可扩展性的工程架构,使其能够快速对新的订票邮件提供支持。