SQL去重核心在于“选”而非“删”,需按场景分四步:一查重复(GROUP BY+HAVING);二去重展示(DISTINCT或ROW_NUMBER());三慎删数据(自关联或NOT IN);四源头防重(UNIQUE约束、幂等控制)。

SQL去重查询的核心是识别并消除重复数据,关键不在于“删”,而在于“选”——用合适的方式从结果集中只保留一条代表记录。掌握它需要分清场景:是查重、去重展示,还是真正删除重复行?下面按实际使用逻辑一步步拆解。
一、查出哪些数据重复了(诊断阶段)
先确认重复依据:通常按业务主键或多个字段组合判断是否重复。比如用户表中手机号重复,或订单表中(用户ID+商品ID+下单时间)相同即视为重复。
用 GROUP BY + HAVING 找出重复组:
- SELECT user_id, phone, COUNT(*) FROM users GROUP BY phone HAVING COUNT(*) > 1;
- 这能列出所有重复的手机号及重复次数,是后续处理的前提。
二、查询时跳过重复,只取每组一条(去重展示)
这是最常见需求:比如列表页不希望同一个人出现多次,但又不能删数据。
版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。
还木有评论哦,快来抢沙发吧~