SQL时间序列统计核心在于时间分组逻辑、时序连续性、业务窗口三点:需归一化时间字段对齐粒度,LEFT JOIN补全日期序列确保连续,优先用RANGE按真实时间滑动窗口,并选用timestamptz避免时区问题。

SQL时间序列统计,核心不是写多复杂的查询,而是理清“时间怎么切、数据怎么对齐、聚合怎么不漏不重”。只要抓住时间分组逻辑、时序连续性、业务窗口这三点,大部分场景都能稳住。
时间分组:别只用GROUP BY时间字段
直接按原始时间字段(比如created_at)GROUP BY,往往颗粒度太细或不对齐。比如想看“每天订单量”,但created_at是精确到秒的,得先归一化。
- 用DATE(created_at)提取日期,适用于日粒度汇总
- 用DATE_TRUNC('week', created_at)(PostgreSQL)或YEARWEEK(created_at, 1)(MySQL)对齐自然周
- 注意时区!数据库默认时区和业务时区不一致时,先AT TIME ZONE转换再截取,否则凌晨下单可能算进前一天
补全缺失日期:让图表不跳空、分析不误导
真实数据常有某天没记录,但统计报表需要连续横轴。靠LEFT JOIN生成完整日期序列最可靠。
- 用递归CTE或GENERATE_SERIES(PG)/数字表(MySQL)生成目标时间段的每日/每小时序列
- LEFT JOIN你的业务表,用COALESCE(count, 0)把NULL转成0
- 别用WHERE过滤后再JOIN——会把补的0又过滤掉,条件要写在ON里或外层处理
滚动窗口与业务周期:SUM() OVER不是万能的
计算“最近7天销量”不能只依赖ROWS BETWEEN 6 PRECEDING AND CURRENT ROW,因为原始数据未必每天都有,ROWS按行数算,容易跨过实际空白期。
标签: mysql
版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。
还木有评论哦,快来抢沙发吧~