内容简介:翻译自:https://stackoverflow.com/questions/14664578/bigquery-sql-running-totals
知道如何计算BigQuery SQL中的运行总数吗?
id value running total -- ----- ------------- 1 1 1 2 2 3 3 4 7 4 7 14 5 9 23 6 12 35 7 13 48 8 16 64 9 22 86 10 42 128 11 57 185 12 58 243 13 59 302 14 60 362
使用相关标量查询的传统 SQL 服务器不是问题:
SELECT a.id, a.value, (SELECT SUM(b.value)
FROM RunTotalTestData b
WHERE b.id <= a.id)
FROM RunTotalTestData a
ORDER BY a.id;
或加入:
SELECT a.id, a.value, SUM(b.Value)
FROM RunTotalTestData a,
RunTotalTestData b
WHERE b.id <= a.id
GROUP BY a.id, a.value
ORDER BY a.id;
但我找不到让它在BigQuery中运行的方法……
你可能已经弄清楚了.但这是一种,而不是最有效的方式:
JOIN只能使用相等比较来完成,即不能使用b.id<= a.id. https://developers.google.com/bigquery/docs/query-reference#joins
如果你问我,这太蹩脚了.但有一项工作.只需对某些虚拟值使用相等比较来获取笛卡尔积,然后使用WHERE作为<=.这是疯狂的次优.但如果你的桌子很小,那就可以了.
SELECT a.id, SUM(a.value) as rt FROM RunTotalTestData a JOIN RunTotalTestData b ON a.dummy = b.dummy WHERE b.id <= a.id GROUP BY a.id ORDER BY rt
您也可以手动约束时间:
SELECT a.id, SUM(a.value) as rt
FROM (
SELECT id, timestamp RunTotalTestData
WHERE timestamp >= foo
AND timestamp < bar
) AS a
JOIN (
SELECT id, timestamp, value RunTotalTestData
WHERE timestamp >= foo AND timestamp < bar
) b ON a.dummy = b.dummy
WHERE b.id <= a.id
GROUP BY a.id
ORDER BY rt
更新:
您不需要特殊的财产.你可以使用
SELECT 1 AS one
加入那个.
随着计费的进行,连接表计入处理.
翻译自:https://stackoverflow.com/questions/14664578/bigquery-sql-running-totals
以上所述就是小编给大家介绍的《google-bigquery – 运行总计的BigQuery SQL》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!
猜你喜欢:- 运行过程+运行效率
- dotnet 判断程序当前使用管理员运行降低权使用普通权限运行
- Flink 集群运行原理兼部署及Yarn运行模式深入剖析-Flink牛刀小试
- MapReduce运行流程分析
- 浅析Docker运行安全
- JavaScript运行原理分析
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
高可用MySQL
)Charles Bell Mats Kindahl Lars Thalmann / 宁青、唐李洋 诸云萍 / 电子工业出版社 / 2011-10 / 98.00元
《高可用mysql:构建健壮的数据中心》是“mysql high availability”的中文翻译版,主要讲解真实环境下如何使用mysql 的复制、集群和监控特性,揭示mysql 可靠性和高可用性的方方面面。本书由mysql 开发团队亲自执笔,定位于解决mysql 数据库的常见应用瓶颈,在保持mysql 的持续可用性的前提下,挖潜各种提高性能的解决方案。本书分为三个部分。第一部分讲述mysql......一起来看看 《高可用MySQL》 这本书的介绍吧!