一直以来,大数据的使用远远不及大数据收集能力,就起原因主要是目前企业的数据主要分散在不同的系统或组织,大数据战略的杀手锏就是能够更深度的,更丰富的挖掘所有数据系统中的有价值的信息,从而更准确的预测客户行为,发现商业价值,但是目前很难将这些数据移到一个单独的数据存储中,另外,安全和监管问题也得不到保障,Oracle Big Data SQL的推出解决了现在面临的难题。 以下为译文: 发现企业或组织对数据管理架构的需求,Oracle推出Big Data SQL软件来整合包括Hadoop、NoSQL和Oracle数据库等在内的各种各样的数据源。 一套完整的解决方案是使Oracle的大数据设备和Big Data SQL结合起来,Cloudera的 Hadoop 分布式和Oracle自己的 NoSQL 数据库。开始时Oracle Big Data SQL只支持Apache Hive和Hadoop File System,其他供应商需要移植SQL关系数据库到Hadoop上运行。
Oracle提供大数据设备和Big Data SQL的一套完整解决方案 Oracle Big Data SQL产品意味着管理员在处理非关系型数据库或Hadoop中的信息时,不用再学习其他查询语言,Oracle的大数据分析主管Neil Mendelson说。 我们可以使用我们已经习惯使用的Oracle SQL语言——完整的SQL语言,我们现在可以直接访问这三个中的任何一个数据源或其中任意组合,他解释道。 类似的工具都可以在开源社区如Stinger中获得,这使得你可以使用SQL命令来查询Hadoop中数据,或使用旨在NoSQL系统上实现SQL命令的CQL语言(Cassandra查询语言)。 创建这个大数据管理系统的目标是希望SQL查询能够运行在不同的数据源上,并且使企业或组织能够利用现有的技术维护企业级数据安全,以及管理敏感的信息。Oracle表示这项技术其独特的架构和Smart Scan继承于Oracle Exadata,同时能够允许Oracle Big Data SQL查询所有形式的结构化和非结构化数据,并且最小化数据移动。 这也促进了Oracle数据库的安全功能,包括组织现有的安全策略,扩展到Hadoop和NoSQL数据。 Oracle的Dan McClary说,产品的开发已经有一段时间了,而且它超越了现有的技术。他同时表示Big Data SQL与HDFS DataNodes和YARN NodeManagers能够co-resident,另外,从新的外部表的查询被发送到这些服务能够保证直接路径读取和数据本地化。 Cloudera创始人、董事长兼首席战略官Mike Olson说:“在oracle的大数据设备上运行Cloudera的软件集比DIY集群部署更具成本效益并且速度更快。在Hadoop查询数据时,我们已经看到客户对SQL强烈的需求。”