当前位置:首页 > 站长知识 > 数据库 > 正文内容

MySQL之dense_rank()分组排序函数的用法详解

2024-11-29数据库41

DENSE_RANK()是一种窗口函数,用于在数据库中计算密集等级。它为每个行分配一个密集等级,并根据指定的排序顺序进行排列。比如:如果有两个排名为1的值,接下来的值将会被标记为2,而不是3。

一、dense_rank() 函数

DENSE_RANK() 也是一个窗口函数,用于为结果集中的每一行分配排名。DENSE_RANK() 在遇到相同的排序值时,会为相同的行分配相同的排名,并且下一个排名不会跳过。换句话说,如果有两个排名为1的值,接下来的值将会被标记为2,而不是3。

语法结构:

1
2
3
4
DENSE_RANK() OVER (
    PARTITION BY <expression>[{,<expression>...}]
    ORDER BY <expression> [ASC|DESC], [{,<expression>...}]
)
  • PARTITION BY:用于将结果集分区,针对每个分区单独排名。

  • ORDER BY:指定排序的列,决定了排名的依据。

注意,over()里头的分组以及排序的执行晚于 where 、group by、 order by 的执行。

二、使用案例

数据准备:

1
2
3
4
5
6
7
8
9
10
11
12
13
create table `student`(
    id int(10) not null primary key,
    name varchar(20) not null,
    score int(10) not null
);
 
insert into `student` values(1,'a',100);
insert into `student` values(2,'b',100);
insert into `student` values(3,'c',95);
insert into `student` values(4,'d',95);
insert into `student` values(5,'e',95);
insert into `student` values(6,'a',90);
insert into `student` values(7,'a',89);

表数据:

2.1、按成绩进行排名

1
select *,dense_rank() over(order by score desc) as dr from `student`;

两个并列第一名后,下一个是第二名,不会跳过排名。

上图中over中没有使用partition进行分组,默认都是同一组

2.2、获取排名前五的数据

1
2
3
4
select * from (
  select name, score, dense_rank() over (order by score desc) as dr
  from `student`
) a  where `dr` <=5;

2.3、分组后再排名

1
2
select name,score,dense_rank() over(partition by name order by score desc) as dr
from `student`;

首先,PARTITION BY子句按姓名将结果集分成多个分区。

然后,ORDER BY子句按分数对结果集进行排序。

三、总结

在数据分析中,ROW_NUMBER()、RANK() 和 DENSE_RANK() 是非常有用的工具。它们可以帮助用户快速对数据进行排名和分类分析。虽然这三种函数的作用相似,但因其在处理重复值时的行为不同,所以在使用时需要根据具体需求进行选择。

3.1、row_number()、rank() 和 dense_rank() 的区别

  • ROW_NUMBER():为每一行分配唯一的行号,适合唯一标识需求。

  • RANK():为重复值分配相同的排名,并在后续排名中跳过名次,适合需要处理排名的场景。

  • DENSE_RANK():为重复值分配相同的排名,但不跳过名次,适合希望连续排名的场景。

下面表格总结了这三个函数的主要区别:

函数特点排名示例
ROW_NUMBER为每行分配唯一的数字1, 2, 3, 4, …
RANK相同的值共享相同的排名,排名会跳过数字1, 1, 3, 4, …
DENSE_RANK相同的值共享相同的排名,不跳过数字1, 1, 2, 3, …