内容简介:Prometheus包括一个本地磁盘时间序列数据库,但也可选择与远程存储系统集成。Prometheus的本地时间序列数据库以自定义格式在磁盘上存储时间序列数据。摄取的样本分为两小时的块。每个两小时的块包含一个目录,其中包含一个或多个块文件,其中包含该时间窗口的所有时间序列样本,以及元数据文件和索引文件(将度量标准名称和标签索引到块文件中的时间序列) )。通过API删除系列时,删除记录存储在单独的逻辑删除文件中(而不是立即从块文件中删除数据)。
Prometheus包括一个本地磁盘时间序列数据库,但也可选择与远程存储系统集成。
一、本地存储
Prometheus的本地时间序列数据库以自定义格式在磁盘上存储时间序列数据。
1.1 磁盘布局
摄取的样本分为两小时的块。每个两小时的块包含一个目录,其中包含一个或多个块文件,其中包含该时间窗口的所有时间序列样本,以及元数据文件和索引文件(将度量标准名称和标签索引到块文件中的时间序列) )。通过API删除系列时,删除记录存储在单独的逻辑删除文件中(而不是立即从块文件中删除数据)。
当前传入样本的块保存在内存中,但尚未完全保留。通过预写日志(WAL)防止崩溃,可以在崩溃后重新启动Prometheus服务器时重放。预写日志文件以128MB段存储在wal目录中。这些文件包含尚未压缩的原始数据,因此它们比常规块文件大得多。 Prometheus将保留至少3个预写日志文件,但是高流量服务器可能会看到三个以上的WAL文件,因为它需要保留至少两个小时的原始数据。
Prometheus服务器的数据目录的目录结构如下所示:
./data/01BKGV7JBM69T2G1BGBGM6KB12 ./data/01BKGV7JBM69T2G1BGBGM6KB12/meta.json ./data/01BKGTZQ1SYQJTR4PB43C8PD98 ./data/01BKGTZQ1SYQJTR4PB43C8PD98/meta.json ./data/01BKGTZQ1SYQJTR4PB43C8PD98/index ./data/01BKGTZQ1SYQJTR4PB43C8PD98/chunks ./data/01BKGTZQ1SYQJTR4PB43C8PD98/chunks/000001 ./data/01BKGTZQ1SYQJTR4PB43C8PD98/tombstones ./data/01BKGTZQ1HHWHV8FBJXW1Y3W0K ./data/01BKGTZQ1HHWHV8FBJXW1Y3W0K/meta.json ./data/01BKGV7JC0RY8A6MACW02A2PJD ./data/01BKGV7JC0RY8A6MACW02A2PJD/meta.json ./data/01BKGV7JC0RY8A6MACW02A2PJD/index ./data/01BKGV7JC0RY8A6MACW02A2PJD/chunks ./data/01BKGV7JC0RY8A6MACW02A2PJD/chunks/000001 ./data/01BKGV7JC0RY8A6MACW02A2PJD/tombstones ./data/wal/00000000 ./data/wal/00000001 ./data/wal/00000002 复制代码
最初的两小时块最终会在后台压缩成更长的块。
请注意,本地存储的限制是它不是群集或复制的。 因此,面对磁盘或节点中断,它不是任意可扩展的或持久的,因此应该被视为更近期数据的短暂滑动窗口。 但是,如果您的耐久性要求不严格,您仍可以成功地在本地存储中存储多达数年的数据。
有关文件格式的更多详细信息,请参阅 TSDB格式 。
二、运营方面
Prometheus有几个标志,允许配置本地存储。 最重要的是:
-
--storage.tsdb.path
:这决定了Prometheus写入数据库的位置。 默认为data/
。 -
--storage.tsdb.retention.time
:这决定了何时删除旧数据。 默认为15d
。 如果此标志设置为默认值以外的任何值,则覆盖storage.tsdb.retention
。 -
--storage.tsdb.retention.size
:[EXPERIMENTAL]这确定了存储块可以使用的最大字节数(请注意,这不包括WAL大小,这可能很大)。 最早的数据将被删除。 默认为0
或禁用。 此标志是实验性的,可以在将来的版本中进行更改。 支持的单位:KB,MB,GB,PB。 例如:“512MB” -
--storage.tsdb.retention
:不推荐使用此标志,而使用storage.tsdb.retention.time
。
平均而言,Prometheus每个样本仅使用大约1-2个字节。 因此,要规划Prometheus服务器的容量,您可以使用粗略的公式:
needed_disk_space = retention_time_seconds * ingested_samples_per_second * bytes_per_sample
要调整每秒摄取样本的速率,您可以减少抓取的时间序列数(每个目标的目标更少或更少的系列),或者可以增加刮擦间隔。然而,由于一系列样品的压缩,减少系列数可能更有效。
如果您的本地存储因任何原因而损坏,最好的办法是关闭Prometheus并删除整个存储目录。 Prometheus的本地存储不支持非POSIX兼容的文件系统,可能会发生损坏,无法恢复。 NFS只是潜在的POSIX,大多数实现都不是。您可以尝试删除单个块目录以解决问题,这意味着每个块目录丢失大约两个小时的数据时间窗口。同样,普罗米修斯的本地存储并不意味着持久的长期存储。
如果同时指定了时间和大小保留策略,则在该时刻将使用先触发的策略。
三、远程存储集成
Prometheus的本地存储在可扩展性和耐用性方面受到单个节点的限制。 Prometheus没有尝试解决Prometheus本身的集群存储问题,而是提供了一组允许与远程存储系统集成的接口。
3.1 概述
rometheus以两种方式与远程存储系统集成:
Prometheus可以以标准格式将其提取的样本写入远程URL。 Prometheus可以以标准格式从远程URL读取(返回)样本数据。
读写协议都使用基于HTTP的snappy压缩协议缓冲区编码。这些协议尚未被视为稳定的API,并且可能会在将来更改为使用gRPC over HTTP/2,此时可以安全地假设Prometheus和远程存储之间的所有跃点都支持HTTP/2。
有关在Prometheus中配置远程存储集成的详细信息,请参阅Prometheus配置文档的远程写入和远程读取部分。
有关请求和响应消息的详细信息,请参阅 远程存储协议缓冲区 定义。
请注意,在读取路径上,Prometheus仅从远程端获取一组标签选择器和时间范围的原始系列数据。对原始数据的所有PromQL评估仍然发生在Prometheus本身。这意味着远程读取查询具有一定的可伸缩性限制,因为需要首先将所有必需的数据加载到查询Prometheus服务器中,然后在那里进行处理。但是,支持PromQL的完全分布式评估暂时被认为是不可行的。
以上所述就是小编给大家介绍的《Prometheus学习系列(二十四)之存储》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!
猜你喜欢:- InnoDB 存储引擎的事务学习
- InnoDB 存储引擎的文件学习
- 学习 Alluxio(三):HDFS 底层存储
- InnoDB 存储引擎的锁学习
- DOCKER学习_014:Docker存储补充
- DOCKER学习_006:Docker存储驱动
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
New Dark Age
James Bridle / Verso Books / 2018-7-17 / GBP 16.99
As the world around us increases in technological complexity, our understanding of it diminishes. Underlying this trend is a single idea: the belief that our existence is understandable through comput......一起来看看 《New Dark Age》 这本书的介绍吧!