MapR Technologies和Apache Hadoop已经合作开发自己的流行开源批处理分析软件包,他们于3月5日宣布,MapR Hadoop将与Informatica的数据集成平台一起使用。共享资源是此处的有效术语。现在可以从四个不同的供应商处访问此新的分析软件。
现在可以从Informatica网站免费下载Informatica HParser Community Edition,现在可以从MapR网站免费获得,作为MapR发行的一部分。此外,还可通过EMC Greenplum MR Edition以及作为Cisco Unified Computing System的一部分获得MapR发行版。
通过同时使用MapR和Informatica,企业可以执行高性能的数据集成,复制和消息传递并快速获取报告。这两种产品在一起可以每小时将大量TB的事务,交互和流数据移动到MapR中,此外还可以在Hadoop中本地解析和处理一系列结构化和非结构化数据,而无需编写脚本。
Informatica HParser为Hadoop开发人员提供了解析功能,可解决包括日志,呼叫数据记录,行业标准,文档以及二进制或分层数据在内的数据源。
MapR和Informatica组合的主要功能包括:
与Informatica PowerCenter和Informatica PowerExchange的双向数据集成。
使用Informatica FastClone进行快照复制。
使用Informatica Ultra Messaging进行数据流传输。
使用Informatica HParser在MapR上并行解析和转换。
Gartner研究部副总裁Merv Adrian表示:“随着大数据生态系统的不断发展,需要采用数据管理方法来应对信息量,多样性,速度和复杂性方面的挑战。
“结合高级数据管理实践是组织在构建扩展应用程序的广度和深度的平台时需要采取的下一步。”