文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

MySQL中怎么清除结果集的重复数据

2024-04-02 19:55

关注

这期内容当中小编将会给大家带来有关MySQL中怎么清除结果集的重复数据,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。

一、关键字Distinct和Distinctrow
  关键字distinct一般直接跟在查询语句中SELECT的后面,替换可选的关键字all,而关键字all是默认的。Distinctrow是distinct的别名,它产生的效果与distinct是完成一样的:

双击代码全选
1 2 3 4SELECT [ALL | DISTINCT | DISTINCTROW ]select_expr[FROM table_references[WHERE where_condition]

  为了说明这些关键字的用法,我们以下表中的数据为例来进行说明。其中,该表含有一些水果名称及其对应的颜色:

  以下查询将从上表中检索所有水果的名称,并按字母顺序将其列出:

双击代码全选
1 2SELECT nameFROM fruits;

  由于没有附带颜色信息,所以每种水果品种的是重复的:

  现在,让我们使用关键字distinct再查询一次,看看结果如何:

双击代码全选
1 2SELECT DISTINCT nameFROM fruits;

  不出所料,由于附带了水果的颜色信息,所以每种水果的名称只出现了一次:

  二、重复数据的取舍
  有时候,是不能使用关键字distinct的,因为删除复制的数据会导致错误的结果。请考虑下列情形:
  客户想要生成一张职工表,以便进行某些资料统计。 为此,我们可以使用下列命令:

双击代码全选
1 2 3 4 5SELECT name,        gender,              salaryFROM employeesORDER BY name;

  奇怪的是,结果中出现了重复的“Kristen Ruegg”:

   客户说,他们不希望出现重复,所以开发人员在SELECT语句中加入了关键字distinct。 好了,这会能够满足客户的要求了,但是问题也随之而来了,因为公司确实有两个重名的员工。所以,添加关键字distinct删除了一个有效的记录,因此得 到的结果实际上错误的。我们可以通过emp_id_number来确认一下,的确有两名员工都叫Kristen Rueggs:

双击代码全选
1 2 3 4 5 6SELECT name,        gender,              salary,        emp_id_numberFROM employeesORDER BY name;

  下面是出现问题的数据,它们的emp_id_numbers都是唯一的:

  上面的情形告诉我们:使用关键字distinct的时候,要确保不会无意中删除有效数据!
  三、关键字Distinct与Group By的区别
   使用distinct与不使用聚合功能情况下对全选所有栏数据进行分组的逻辑效果是一样的。对于这样的查询,group by命令只是生产了一列分组后的值。在显示某栏并对齐分组的时候,该查询会给出该栏中不同的值。然而,在显示多栏并对它们进行分组的时候,该查询会给出每 栏中的值的不同的组和。例如,以下查询生成的结果与第一个SELECT distinct命令的结果完全一样:

双击代码全选
1 2 3SELECT nameFROM fruits GROUP BY name;

  同样地,以下语句生成的结果,与我们的SELECT distinct语句在员工表上生成的结果也完全一样:

双击代码全选
1 2 3 4 5SELECT name,        gender,              salary FROM employeesGROUP BY name;

  关键字distinct和group by的区别在于,group by子句会对数据记录进行排序。因此:

双击代码全选
1 2 3 4 5 6 7 8 9 10 11SELECT name,        gender,              salary FROM employeesGROUP BY name;  或者:SELECT DISTINCT name,                 gender,                       salary FROM employeesORDER BY name;

四、统计重复的数据
  关键字Distinct可以用于COUNT()函数,来统计一栏中包含多少不同的值。COUNT ( distinct expression)将统计给定表达式在不同的非零值的数量。该表达式可以是要统计其中不同的非零值的数量的栏名。
  下面是表employee中的所有数据:

  对name字段应用Count distinct函数会得到六个不同的名称:

上述就是小编为大家分享的MySQL中怎么清除结果集的重复数据了,如果刚好有类似的疑惑,不妨参照上述分析进行理解。如果想知道更多相关知识,欢迎关注亿速云行业资讯频道。

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-数据库
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯