Apache Impala 3.0.1 发布,高性能的分布式 SQL 引擎

栏目: 软件资讯 · 发布时间: 6年前

内容简介:Apache Impala 3.0.1 发布了。暂未发现更新内容的介绍,点此保持关注。 下载地址: https://impala.apache.org/downloads.html Apache Impala 是一个高性能分布式 SQL 引擎,是用于处理存储在 Hadoop 集群中的大量...

Apache Impala 3.0.1 发布了。暂未发现更新内容的介绍,点此保持关注

下载地址:

Apache Impala 是一个高性能分布式 SQL 引擎,是用于处理存储在 Hadoop 集群中的大量数据的 MPP(大规模并行处理)SQL 查询引擎。用 C++ 和 Java 编写而成,与其他 Hadoop 的 SQL 引擎相比,它提供了高性能和低延迟。

Impala 通过使用标准组件(如 HDFS,HBase,Metastore,YARN 和 Sentry)将传统分析数据库的 SQL 支持和多用户性能与 Apache Hadoop 的可扩展性和灵活性相结合。

  • 使用 Impala,与其他 SQL 引擎(如 Hive)相比,用户可以使用 SQL 查询以更快的方式与 HDFS 或 HBase 进行通信。

  • Impala 可以读取 Hadoop 使用的几乎所有文件格式,如 Parquet,Avro,RCFile。

Impala 将相同的元数据,SQL 语法(Hive SQL),ODBC 驱动程序和用户界面(Hue Beeswax)用作 Apache Hive,为面向批量或实时查询提供熟悉且统一的平台。

与 Apache Hive 不同,Impala 不基于 MapReduce 算法。 它实现了一个基于守护进程的分布式架构,它负责在同一台机器上运行的查询执行的所有方面。

因此,它减少了使用 MapReduce 的延迟,这使得 Impala 比 Apache Hive 快。


【声明】文章转载自:开源中国社区 [http://www.oschina.net]


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

设计沟通十器

设计沟通十器

Daniel M. Brown / 樊旺斌 / 机械工业出版社 / 2008-12 / 49.00元

本书提供了网站设计时所需的可交付文档资料包括:概念模型,站点地图,可用性报告等,这些文档资料是设计人员和客户进行交流的主要工具。本书深入讨论了文档推介和风险规避技巧,向你展示了如何将文档资料按要求制作成有效的交流工具。 本书内容全面,结构清晰,讲解详细。可作为网站设计人员的参考用书。 关于网站设计的多数讨论好像都着眼于流程的创建,然而,要想把概念变为现实,需要一整套强大的可交付文档资料......一起来看看 《设计沟通十器》 这本书的介绍吧!

RGB转16进制工具
RGB转16进制工具

RGB HEX 互转工具

HTML 编码/解码
HTML 编码/解码

HTML 编码/解码

URL 编码/解码
URL 编码/解码

URL 编码/解码