Apache 软件基金会宣布 Apache Pinot 成为顶级项目(Top-Level Project,TLP)
Apache Pinot 是一个分布式大数据分析基础设施,旨在以高吞吐量和低延迟提供可扩展的实时分析。该项目于 2013 年首次在 LinkedIn 创建,于 2015 年开源,并于 2018 年 10 月进入 Apache 孵化器。Amazon-Eero、Doordash、Factual/FourSquare、LinkedIn、Stripe、Uber、Walmart、微博和 WePay 等公司均有所应用。
根据描述,Apache Pinot 的在线分析处理(OLAP)可扩展到数万亿条记录,支持实时从 Apache Kafka、Apache Spark、Apache Hadoop HDFS、平面文件和云存储中提取在线和离线数据源,每秒提供数以千计的查询,并以分布式容错方式提供统一的分析结果。特点包括:
- 以低延迟响应实时数据的 OLAP 查询
- 可插入索引:排序、倒排、文本索引、地理空间索引、JSON 索引、范围索引、布隆过滤器
- 智能物化视图:通过星形树索引进行快速聚合
- 支持不同的流系统,近乎实时提取:有 Apache Kafka、Confluent Kafka、Amazon Kinesis 以及可定制的输入格式,也有开箱即用的 Avro 和 JSON 格式
- 高可用性、可横向扩展和容错性
- 使用 PrestoDB/Trino 支持本地查找连接和完全连接
有关 Apache Pinot 的详细介绍可在其官网查阅。
猜你喜欢:暂无回复。