跨表统计需先理清业务逻辑和数据关系,明确主表、统计维度、关联字段唯一性及空值处理;避免多对多重复计算,善用子查询聚合或EXISTS/IN;注意NULL兜底与性能优化。

跨表统计不是简单拼几个表,关键在理清业务逻辑和数据关系。先确定要算什么、从哪几张表取数、关联字段是否唯一、空值怎么处理——这些想清楚了,SQL自然就顺了。
明确主表和统计维度
别一上来就 JOIN 所有表。先问自己:最终结果按什么分组?比如“每个部门的订单总金额”,那 部门表是主表,订单表是明细表。如果漏掉部门没订单的情况,就得用 LEFT JOIN;如果只看有订单的部门,INNER JOIN 更安全。
- 主表决定结果行数(如部门有5个,结果最多5行)
- 统计字段(如金额、数量)通常来自从表,记得加 SUM()、COUNT() 等聚合函数
- WHERE 条件尽量写在关联后、GROUP BY 前,避免过滤掉不该过滤的主表记录
小心多对多导致的重复计算
订单表 × 订单商品表 × 商品分类表,很容易因一对多叠加变成多对多,SUM(amount) 被放大好几倍。真实案例:某次统计各分类销售额,结果翻了3倍——查出来是同一笔订单含多个商品,又跨了多个分类标签。
- 先用 COUNT(*) 和 COUNT(DISTINCT order_id) 对比,发现差异就说明有重复
- 解决办法:要么在子查询里先聚合(如先按 order_id 汇总金额),再关联分类;要么用 EXISTS/IN 替代 JOIN 做条件判断
- 临时加个 ROW_NUMBER() OVER (PARTITION BY order_id ORDER BY id) 辅助排查也很管用
空值和NULL要主动兜底
LEFT JOIN 后,从表字段可能为 NULL。SUM(NULL) 是 NULL,COUNT(字段) 会忽略 NULL,但 COUNT(*) 不会——这些细节不注意,统计结果就“少了一块”。
版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。
还木有评论哦,快来抢沙发吧~