内容简介:翻译自:https://stackoverflow.com/questions/14664578/bigquery-sql-running-totals
知道如何计算BigQuery SQL中的运行总数吗?
id value running total -- ----- ------------- 1 1 1 2 2 3 3 4 7 4 7 14 5 9 23 6 12 35 7 13 48 8 16 64 9 22 86 10 42 128 11 57 185 12 58 243 13 59 302 14 60 362
使用相关标量查询的传统 SQL 服务器不是问题:
SELECT a.id, a.value, (SELECT SUM(b.value)
FROM RunTotalTestData b
WHERE b.id <= a.id)
FROM RunTotalTestData a
ORDER BY a.id;
或加入:
SELECT a.id, a.value, SUM(b.Value)
FROM RunTotalTestData a,
RunTotalTestData b
WHERE b.id <= a.id
GROUP BY a.id, a.value
ORDER BY a.id;
但我找不到让它在BigQuery中运行的方法……
你可能已经弄清楚了.但这是一种,而不是最有效的方式:
JOIN只能使用相等比较来完成,即不能使用b.id<= a.id. https://developers.google.com/bigquery/docs/query-reference#joins
如果你问我,这太蹩脚了.但有一项工作.只需对某些虚拟值使用相等比较来获取笛卡尔积,然后使用WHERE作为<=.这是疯狂的次优.但如果你的桌子很小,那就可以了.
SELECT a.id, SUM(a.value) as rt FROM RunTotalTestData a JOIN RunTotalTestData b ON a.dummy = b.dummy WHERE b.id <= a.id GROUP BY a.id ORDER BY rt
您也可以手动约束时间:
SELECT a.id, SUM(a.value) as rt
FROM (
SELECT id, timestamp RunTotalTestData
WHERE timestamp >= foo
AND timestamp < bar
) AS a
JOIN (
SELECT id, timestamp, value RunTotalTestData
WHERE timestamp >= foo AND timestamp < bar
) b ON a.dummy = b.dummy
WHERE b.id <= a.id
GROUP BY a.id
ORDER BY rt
更新:
您不需要特殊的财产.你可以使用
SELECT 1 AS one
加入那个.
随着计费的进行,连接表计入处理.
翻译自:https://stackoverflow.com/questions/14664578/bigquery-sql-running-totals
以上所述就是小编给大家介绍的《google-bigquery – 运行总计的BigQuery SQL》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
我的第一本编程书
[日]平山尚 / 张沈宇 / 人民邮电出版社 / 2016-7 / 79.00元
写这本书之前,作者一直在摸索一种最有利于入门者学编程的方法,并应用到教学当中。经过两年的教学实践,他确信他的方法是有效的,于是便有了这本书。这本书面向的是完全没有接触过编程的读者。作者将门槛设置得非常低,读者不需要懂得变量、函数这些名词(这些名词在书中也不会出现),不需要会英语,完全不需要查阅其他书籍,只需要小学算术水平即可。这本书给初学者非常平缓的学习曲线,有利于为之后的进阶学习打下坚实的基础。一起来看看 《我的第一本编程书》 这本书的介绍吧!