内容简介:翻译自:https://stackoverflow.com/questions/14664578/bigquery-sql-running-totals
知道如何计算BigQuery SQL中的运行总数吗?
id value running total -- ----- ------------- 1 1 1 2 2 3 3 4 7 4 7 14 5 9 23 6 12 35 7 13 48 8 16 64 9 22 86 10 42 128 11 57 185 12 58 243 13 59 302 14 60 362
使用相关标量查询的传统 SQL 服务器不是问题:
SELECT a.id, a.value, (SELECT SUM(b.value) FROM RunTotalTestData b WHERE b.id <= a.id) FROM RunTotalTestData a ORDER BY a.id;
或加入:
SELECT a.id, a.value, SUM(b.Value) FROM RunTotalTestData a, RunTotalTestData b WHERE b.id <= a.id GROUP BY a.id, a.value ORDER BY a.id;
但我找不到让它在BigQuery中运行的方法……
你可能已经弄清楚了.但这是一种,而不是最有效的方式:
JOIN只能使用相等比较来完成,即不能使用b.id<= a.id. https://developers.google.com/bigquery/docs/query-reference#joins
如果你问我,这太蹩脚了.但有一项工作.只需对某些虚拟值使用相等比较来获取笛卡尔积,然后使用WHERE作为<=.这是疯狂的次优.但如果你的桌子很小,那就可以了.
SELECT a.id, SUM(a.value) as rt FROM RunTotalTestData a JOIN RunTotalTestData b ON a.dummy = b.dummy WHERE b.id <= a.id GROUP BY a.id ORDER BY rt
您也可以手动约束时间:
SELECT a.id, SUM(a.value) as rt FROM ( SELECT id, timestamp RunTotalTestData WHERE timestamp >= foo AND timestamp < bar ) AS a JOIN ( SELECT id, timestamp, value RunTotalTestData WHERE timestamp >= foo AND timestamp < bar ) b ON a.dummy = b.dummy WHERE b.id <= a.id GROUP BY a.id ORDER BY rt
更新:
您不需要特殊的财产.你可以使用
SELECT 1 AS one
加入那个.
随着计费的进行,连接表计入处理.
翻译自:https://stackoverflow.com/questions/14664578/bigquery-sql-running-totals
以上所述就是小编给大家介绍的《google-bigquery – 运行总计的BigQuery SQL》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!
猜你喜欢:- 运行过程+运行效率
- dotnet 判断程序当前使用管理员运行降低权使用普通权限运行
- Flink 集群运行原理兼部署及Yarn运行模式深入剖析-Flink牛刀小试
- MapReduce运行流程分析
- 浅析Docker运行安全
- JavaScript运行原理分析
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
程序员的职业素养
Robert C.Martin / 章显洲、余晟 / 人民邮电出版社 / 2012-9-1 / 49.00元
本书是编程大师Bob 大叔40 余年编程生涯的心得体会, 讲解成为真正专业的程序员需要什么样的态度、原则,需要采取什么样的行动。作者以自己以及身边的同事走过的弯路、犯过的错误为例,意在为后来人引路,助其职业生涯迈上更高台阶。 本书适合所有程序员,也可供所有想成为具备职业素养的职场人士参考。一起来看看 《程序员的职业素养》 这本书的介绍吧!