论文部分内容阅读
在历经一段时间的概念炒作后,大数据如今已经被人们所普遍熟知。人们关注的焦点也不再停留在什么是大数据、大数据有怎样的特点,而是更多将注意力集中在大数据该如何落地,即我们如何处理这些数据,从而帮助我们分析决策。当然伴随大数据受关注程度的日益增加,各种有关大数据的分析模型、平台、工具也层出不穷。
“要处理这些数据,首先要对各种不同类型的数据进行整理归类,找出规律所在。这其中很重要的一点就是将Web、社交网络等产生的半结构化以及非结构化的数据变成计算机可以理解的内容。”惠普软件集团Autonomy信息分析部副总裁兼总经理Rohit de Souza在接受本报记者采访时表示。
不难看出,数据归类整理是整个数据利用过程的基石,也是大数据发挥价值的关键所在。
对此,业界各类解决方案的普遍做法是首先将大量的各类数据集中到统一的数据仓库中,然后进行整理分类,从而为下一步分析应用做准备。不过其中也有不同,惠普Autonomy便是这样一款大数据分析工具。
“在信息爆炸式增长的时代,将海量的信息移来移去无疑会增加成本和难度。”Rohit表示,惠普Autonomy数据分析工具能够直接对接各类应用所产生的数据,并进行分类整理,而无需数据仓库的介入,这无疑大大增加了数据的处理效率。
这仅是Autonomy数据分析工具的优势之一,类似的领先之处还有很多。比如,其能够根据实际情景、结合上下文,智能识别来自各种应用的各类数据。Rohit还举了一个形象的例子来说明该特性。他说,同样是Apple,它是指水果还是手机?恐怕只有结合实际情景才能做出判断,而Autonomy能够很好地做到这一点。
再比如,Autonomy能够处理各种类型的数据,包括视频、音频、邮件、短消息等,而这些数据可以来自微博、微信等社交媒体,也可以来自传统的企业应用。据Rohit介绍,Autonomy通过连接器能够直接对接400多类应用,几乎囊括了目前市面上的所有应用类型。
正是由于其多方面的优势,Autonomy收获了不错的市场反响。据悉,目前惠普Autonomy数据分析工具已经在包括电信、金融、传媒等在内的多个行业的多种场景得到应用。如中国移动使用该工具可检索任一手机中的应用数据,而中央电视台未来广告则用其捕捉视频中商标等内容的出现频次,同时利用情感分析功能,从观众所发出的微博、微信内容中抓取情感部分,二者相结合以完成二次、三次营销。
从目前情况来看,无论是市场方面还是技术方面,惠普Autonomy在大数据时代都取得了一定的成绩。谈及Autonomy在中国的规划时,Rohit表示,一方面惠普会不断完善产品、提升性能;另一方面惠普则将继续结合中国用户的实际需求,加深产品的本地化程度。
而就在近日,惠普Autonomy刚刚更新其产品线,推出了HP IDOL 10.5版本。其除了加强与HP HAVEn大数据平台的关键组件(包括HP ArcSight、HP Vertica和Apache Hadoop)的集成程度外,还大幅提升了HP IDOL的分析能力、可靠性和易用性,以帮助用户更好地对数据进行整理归类。
“要处理这些数据,首先要对各种不同类型的数据进行整理归类,找出规律所在。这其中很重要的一点就是将Web、社交网络等产生的半结构化以及非结构化的数据变成计算机可以理解的内容。”惠普软件集团Autonomy信息分析部副总裁兼总经理Rohit de Souza在接受本报记者采访时表示。
不难看出,数据归类整理是整个数据利用过程的基石,也是大数据发挥价值的关键所在。
对此,业界各类解决方案的普遍做法是首先将大量的各类数据集中到统一的数据仓库中,然后进行整理分类,从而为下一步分析应用做准备。不过其中也有不同,惠普Autonomy便是这样一款大数据分析工具。
“在信息爆炸式增长的时代,将海量的信息移来移去无疑会增加成本和难度。”Rohit表示,惠普Autonomy数据分析工具能够直接对接各类应用所产生的数据,并进行分类整理,而无需数据仓库的介入,这无疑大大增加了数据的处理效率。
这仅是Autonomy数据分析工具的优势之一,类似的领先之处还有很多。比如,其能够根据实际情景、结合上下文,智能识别来自各种应用的各类数据。Rohit还举了一个形象的例子来说明该特性。他说,同样是Apple,它是指水果还是手机?恐怕只有结合实际情景才能做出判断,而Autonomy能够很好地做到这一点。
再比如,Autonomy能够处理各种类型的数据,包括视频、音频、邮件、短消息等,而这些数据可以来自微博、微信等社交媒体,也可以来自传统的企业应用。据Rohit介绍,Autonomy通过连接器能够直接对接400多类应用,几乎囊括了目前市面上的所有应用类型。
正是由于其多方面的优势,Autonomy收获了不错的市场反响。据悉,目前惠普Autonomy数据分析工具已经在包括电信、金融、传媒等在内的多个行业的多种场景得到应用。如中国移动使用该工具可检索任一手机中的应用数据,而中央电视台未来广告则用其捕捉视频中商标等内容的出现频次,同时利用情感分析功能,从观众所发出的微博、微信内容中抓取情感部分,二者相结合以完成二次、三次营销。
从目前情况来看,无论是市场方面还是技术方面,惠普Autonomy在大数据时代都取得了一定的成绩。谈及Autonomy在中国的规划时,Rohit表示,一方面惠普会不断完善产品、提升性能;另一方面惠普则将继续结合中国用户的实际需求,加深产品的本地化程度。
而就在近日,惠普Autonomy刚刚更新其产品线,推出了HP IDOL 10.5版本。其除了加强与HP HAVEn大数据平台的关键组件(包括HP ArcSight、HP Vertica和Apache Hadoop)的集成程度外,还大幅提升了HP IDOL的分析能力、可靠性和易用性,以帮助用户更好地对数据进行整理归类。