基于hadoop开发大数据平台难度大吗 (基于hadoop的大数据系统)

IBM发布一款Sandbox（沙箱）版本的Big SQL以供桌面使用。沙箱作为单节点docker镜像，为了让用户开始使用Big SQL和Hortonworks数据平台。

基于hadoop的推荐系统demo,基于hadoop作品推荐系统设计

每个沙箱*载下**后，都预先配置了示例数据，教程和练习，以便用户完成配置并启动它，IBM表示可在在30分钟内启动并运行Big SQL。

IBM Big SQL是针对Hadoop的SQL引擎。IBM与Hortonworks合作，将HDP（Hortonworks Data Platform）与IBM Big SQL集成，Big SQL 5扩展了Hive的功能，并利用HBase和Spark提供了一个集成的分析选项。

Big SQL利用IBM Fluid Query从许多不同的数据存储（如Hive，HBase，Spark，DB2，Oracle，SQL Server，Netezza，Informix，Teradata，WebHDFS和对象存储）中虚拟化数据。

基于hadoop的推荐系统demo,基于hadoop作品推荐系统设计

IBM Fluid Query于2015年推出。它由Netezza提供支持，可用于创建联合查询，其中数据来自各种来源，而不需要用户处理多个数据存储或查询系统。Fluid Query还可用于执行和控制数据存储库之间的批量数据移动。Netezza创建了第一个数据仓库设备，也开发了高级分析应用程序。在2010年被IBM收购。

Big SQL提供与Spark的双向集成，并支持Spark执行程序和Big SQL工作者节点之间的综合。除了大数据支持外，它还支持其他产品（如IBM DB2数据库和IBM Netezza数据仓库设备和Oracle数据库）的SQL语句，包括内置的Oracle SQL和PL/SQL语句支持。IBM的希望是，针对Oracle编写的应用程序将被转移到Big SQL中运行，因为它们可以通过最小的更改进行移动。

Big SQL还通过Slider提供YARN集成。YARN是Apache的集群管理技术，而Slider扩展了Hadoop和YARN，让其他数据库在YARN中运行而无需修改。IBM还为Big SQL添加了一种称为“弹性增强”的新技术。IBM表示，通过为每个节点启用多个工作人员的分配，可以将Big SQL的性能提升高达50％，以提高CPU和内存利用率。

基于hadoop的推荐系统demo,基于hadoop作品推荐系统设计

Big SQL还附带符合ANSI标准的SQL解析器，可以运行所有99个TPC-DS查询，而无需使用新API进行查询修改和结构化流。