内容简介:Apache Impala 3.0.0 已正式发布,暂未发现更新内容的介绍,点此保持关注。 下载地址:https://impala.apache.org/downloads.html Apache Impala 是一个高性能分布式 SQL 引擎,是用于处理存储在 Hadoop 集群中的...
Apache Impala 3.0.0 已正式发布,暂未发现更新内容的介绍,点此保持关注。
下载地址:https://impala.apache.org/downloads.html
Apache Impala 是一个高性能分布式 SQL 引擎,是用于处理存储在 Hadoop 集群中的大量数据的 MPP(大规模并行处理)SQL 查询引擎。用 C++ 和 Java 编写而成,与其他 Hadoop 的 SQL 引擎相比,它提供了高性能和低延迟。
Impala 通过使用标准组件(如 HDFS,HBase,Metastore,YARN 和 Sentry)将传统分析数据库的 SQL 支持和多用户性能与 Apache Hadoop 的可扩展性和灵活性相结合。
使用 Impala,与其他 SQL 引擎(如 Hive)相比,用户可以使用 SQL 查询以更快的方式与 HDFS 或 HBase 进行通信。
Impala 可以读取 Hadoop 使用的几乎所有文件格式,如 Parquet,Avro,RCFile。
Impala 将相同的元数据,SQL 语法(Hive SQL),ODBC 驱动程序和用户界面(Hue Beeswax)用作 Apache Hive,为面向批量或实时查询提供熟悉且统一的平台。
与 Apache Hive 不同,Impala 不基于 MapReduce 算法。 它实现了一个基于守护进程的分布式架构,它负责在同一台机器上运行的查询执行的所有方面。
因此,它减少了使用 MapReduce 的延迟,这使德 Impala 比 Apache Hive 快。
【声明】文章转载自:开源中国社区 [http://www.oschina.net]
以上所述就是小编给大家介绍的《Apache Impala 3.0.0 发布,高性能的分布式 SQL 引擎》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!
猜你喜欢:- Memcached 1.6 发布,高性能分布式缓存系统
- Memcached 1.5.10 发布,高性能分布式缓存系统
- Memcached 1.5.11 发布,高性能分布式缓存系统
- 高性能分布式存储在核心数据库的应用
- Memcached 1.5.12 发布,高性能分布式缓存系统
- Ray 0.6.1 发布,高性能分布式执行框架
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Wikis For Dummies
Dan Woods、Peter Thoeny / For Dummies / 2007-7-23 / USD 24.99
Corporations have finally realized the value of collaboration tools for knowledge sharing and Wiki is the open source technology for creating collaborative Web sites, as either a public site on the In......一起来看看 《Wikis For Dummies》 这本书的介绍吧!