分布式数据仓库系统 Apache Tajo

码农软件 · 软件分类 · 大数据 · 2020-02-14 09:44:17

软件介绍

Tajo 是一个分布式数据仓库系统,基于 Hadoop 实现,特点是低延迟、高可伸缩,提供专用查询和 ETL 工具

特点:

  • 可伸缩性和低延迟

    • 完全分布式的 SQL 查询处理,基于存储雨 HDFS 的大数据集

    • 超低响应时间(约100毫秒),在合理数据范围内的简单查询

  • 支持长时间运行的查询

    • 容错支持,避免某些任务失败后的查询重启

    • 动态调度,处理和异构集群节点故障

  • ETL

    • ETL 可实现不同数据格式之间的转换

    • 支持多种文件格式,如 CSV、RCFile 和 RowFile

  • 扩展性

    • 支持用户自定义函数

    • 提供自定义文件格式的 Scanner/Appender 接口

  • 兼容性

    • 遵循 ANSI/ISO SQL 标准,非标准方面遵循 PostgreSQL 规范

    • 支持 HiveQL 模式

    • 在 HCatalog 和 Hive MetaStore 实现表访问

    • 支持 JDBC 驱动

  • 简单

    • 提供交互式 Shell 来提交 SQL 查询到 Tajo 集群

    • 提供备份和恢复工具

    • 异步/同步 Java API 来提交 SQL 查询到 Tajo 集群

本文地址:https://codercto.com/soft/d/25579.html

Google软件测试之道

Google软件测试之道

James A. Whittaker、Jason Arbon、Jeff Carollo / 黄利、李中杰、薛明 / 人民邮电出版社 / 2013-10 / 59.00元

每天,google都要测试和发布数百万个源文件、亿万行的代码。数以亿计的构建动作会触发几百万次的自动化测试,并在好几十万个浏览器实例上执行。面对这些看似不可能完成的任务,谷歌是如何测试的呢? 《google软件测试之道》从内部视角告诉你这个世界上知名的互联网公司是如何应对21世纪软件测试的独特挑战的。《google软件测试之道》抓住了google做测试的本质,抓住了google测试这个时代最......一起来看看 《Google软件测试之道》 这本书的介绍吧!

Base64 编码/解码
Base64 编码/解码

Base64 编码/解码

Markdown 在线编辑器
Markdown 在线编辑器

Markdown 在线编辑器