论文部分内容阅读
大多数的组织机构都清楚意识到制定战略性的数据驱动型策略对于保持竞争力和可持续性起到至关重要的作用,但是不少组织机构,特别是传统领域企业,并不清楚如何基于大数据驱动其发展,甚至找不到合适的工具来利用大数据。 以留学行业为例,留学业作为咨询行业的分支,没有固定资产投入也没有原材料的投入,其主要投入是用于市场营销获得潜在客户数据方面,可以说留学机构的经营高度依赖潜在客户数据,数据获取能力直接关系到企业的经营状况。但是留学机构现有的数据获取渠道相对传统、成本高、来源不稳、数据信息真实性差、缺乏独立性。 鉴于以上问题,本文围绕语义技术试图在留学行业中的大数据应用做一部分探索工作,构建了基于语义技术的潜在留学客户数据采集系统,从公开的社交媒体的语料大数据中挖掘潜在留学客户数据。 该系统的构建初步达到了自动发现有留学意向且同时适龄的潜在客户并建立档案的目的,使留学机构初步拥有了一个低成本、来源稳定、潜在客户数据信息真实全面、可独立完成的客户数据渠道。该系统专门开发的留学领域词典覆盖37915个领域词汇,相比不使用留学领域词典,检出率大幅提高,F值从47.31%上升到97.09%。基于留学领域词的身份识别算法的总准确率达到了95.58%,适龄算法的准确率达到了98.48%。 相信在未来,该系统能够在最高层次上不断解锁困扰留学行业的大数据封印,最终解决了留学机构挖掘数据价值时面临的重要大挑战。