SQLServer中Partition By和row_number 函数使用方法详解

在处理大规模数据集时,SQL Server 提供了许多强大的工具来优化查询性能和简化复杂的数据操作。其中,PARTITION BY 子句和 ROW_NUMBER() 函数是两个非常有用的功能。它们可以帮助我们对数据进行分组、排序,并生成唯一的行号,从而实现各种复杂的业务需求。本文将详细介绍这两个功能的使用方法,并通过实例演示其应用场景。

partition by关键字是分析性函数的一部分,它和聚合函数不同的地方在于它能返回一个分组中的多条记录,而聚合函数一般只有一条反映统计值的记录,partition by用于给结果集分组,如果没有指定那么它把整个结果集作为一个分组。

今天群里看到一个问题,在这里概述下:查询出不同分类下的最新记录。一看这不是很简单的么,要分类那就用Group By;要最新记录就用Order By呗。然后在自己的表中试着做出来:

首先呢我把表中的数据按照提交时间倒序出来:

图片[1]-SQLServer中Partition By和row_number 函数使用方法详解-趣考网

“corp_name”就是分类的GUID(请原谅我命名的随意性)。 OK, 这里按照最开始的想法加上Group By来看一下显示效果:

图片[2]-SQLServer中Partition By和row_number 函数使用方法详解-趣考网

呃,嗯。这尼玛和想象中的结果不一样啊,看来写代码还是要理性分析问题,意念是无法控制结果滴!

既然要求是不同分类的数据,除了使用Group By之外,还有别的函数能用吗?度娘了一下结果还真有,over(partition by )函数,那么它和平时用的Group By有什么区别呢? Group By除了对结果进行单纯的分组之外呢,一般都和聚合函数一起使用,Partition By也具有分组功能,属于Oracle的分析函数,在这里就不详细的不啦不啦不啦了。

看代码:

图片[3]-SQLServer中Partition By和row_number 函数使用方法详解-趣考网

over(partition by corp_name order by submit_time desc ) as t 。就是按照corp_name分类并按时间倒序出来,\"t\" 这里一列呢就是不同corp_name类出现的次数,需求是只查询出不同分类的最新提交数据,那么我们只需要针对\"t\"再进行一次筛选即可:

图片[4]-SQLServer中Partition By和row_number 函数使用方法详解-趣考网

好啦,结果已经出来,不求各位看官喜欢,但求看在我头像中的胸器望点个赞, 好人一生平安哦!!!

ps:SQL Server数据库partition by 与ROW_NUMBER()函数使用详解

关于SQL的partition by 字段的一些用法心得

先看例子:

ifobject_id(\'TESTDB\')isnotnulldroptableTESTDBcreatetableTESTDB(Avarchar(8),Bvarchar(8))insertintoTESTDBselect\'A1\',\'B1\'unionallselect\'A1\',\'B2\'unionallselect\'A1\',\'B3\'unionallselect\'A2\',\'B4\'unionallselect\'A2\',\'B5\'unionallselect\'A2\',\'B6\'unionallselect\'A3\',\'B7\'unionallselect\'A3\',\'B3\'unionallselect\'A3\',\'B4\'

-- 所有的信息

SELECT*FROMTESTDBAB-------A1B1A1B2A1B3A2B4A2B5A2B6A3B7A3B3A3B4

-- 使用PARTITION BY 函数后

SELECT*,ROW_NUMBER()OVER(PARTITIONBYAORDERBYADESC)NUMFROMTESTDBABNUM-------------A1B11A1B22A1B33A2B41A2B52A2B63A3B71A3B32A3B43

可以看到结果中多出一列NUM 这个NUM就是说明了相同行的个数,比如A1有3个,他就给每个A1标上是第几个。

-- 仅仅使用ROW_NUMBER() OVER的结果

SELECT*,ROW_NUMBER()OVER(ORDERBYADESC)NUMFROMTESTDBABNUM------------------------A3B71A3B32A3B43A2B44A2B55A2B66A1B17A1B28A1B39

可以看到它只是单纯标出了行号。

-- 深入一点应用

SELECTA=CASEWHENNUM=1THENAELSE\'\'END,BFROM(SELECTA,NUM=ROW_NUMBER()OVER(PARTITIONBYAORDERBYADESC)FROMTESTDB)TAB---------A1B1B2B3A2B4B5B6A3B7B3B4

接下来我们就通过几个实例来一一介绍ROW_NUMBER()函数的使用。

实例如下:

1.使用row_number()函数进行编号,如

selectemail,customerID,ROW_NUMBER()over(orderbypsd)asrowsfromQT_Customer

原理:先按psd进行排序,排序完后,给每条数据进行编号。

2.在订单中按价格的升序进行排序,并给每条记录进行排序代码如下:

selectDID,customerID,totalPrice,ROW_NUMBER()over(orderbytotalPrice)asrowsfromOP_Order

3.统计出每一个各户的所有订单并按每一个客户下的订单的金额 升序排序,同时给每一个客户的订单进行编号。这样就知道每个客户下几单了

如图:

图片[5]-SQLServer中Partition By和row_number 函数使用方法详解-趣考网

代码如下:

selectROW_NUMBER()over(partitionbycustomerIDorderbytotalPrice)asrows,customerID,totalPrice,DIDfromOP_Order

4.统计每一个客户最近下的订单是第几次下的订单。

图片[6]-SQLServer中Partition By和row_number 函数使用方法详解-趣考网

代码如下:

withtabsas(selectROW_NUMBER()over(partitionbycustomerIDorderbytotalPrice)asrows,customerID,totalPrice,DIDfromOP_Order)selectMAX(rows)as\'下单次数\',customerIDfromtabsgroupbycustomerID

5.统计每一个客户所有的订单中购买的金额最小,而且并统计改订单中,客户是第几次购买的。

如图:

图片[7]-SQLServer中Partition By和row_number 函数使用方法详解-趣考网

上图:rows表示客户是第几次购买。

思路:利用临时表来执行这一操作。

1.先按客户进行分组,然后按客户的下单的时间进行排序,并进行编号。

2.然后利用子查询查找出每一个客户购买时的最小价格。

3.根据查找出每一个客户的最小价格来查找相应的记录。

代码如下:

withtabsas(selectROW_NUMBER()over(partitionbycustomerIDorderbyinsDT)asrows,customerID,totalPrice,DIDfromOP_Order)select*fromtabswheretotalPricein(selectMIN(totalPrice)fromtabsgroupbycustomerID)

6.筛选出客户第一次下的订单。

图片[8]-SQLServer中Partition By和row_number 函数使用方法详解-趣考网

思路。利用rows=1来查询客户第一次下的订单记录。

代码如下:

withtabsas(selectROW_NUMBER()over(partitionbycustomerIDorderbyinsDT)asrows,*fromOP_Order)select*fromtabswhererows=1select*fromOP_Order

7.rows_number()可用于分页

思路:先把所有的产品筛选出来,然后对这些产品进行编号。然后在where子句中进行过滤。

8.注意:在使用over等开窗函数时,over里头的分组及排序的执行晚于“where,group by,order by”的执行。

如下代码:

selectROW_NUMBER()over(partitionbycustomerIDorderbyinsDT)asrows,customerID,totalPrice,DIDfromOP_OrderwhereinsDT>\'2011-07-22\'

以上代码是先执行where子句,执行完后,再给每一条记录进行编号。

总结

通过本文的介绍,我们可以看到 PARTITION BY 子句和 ROW_NUMBER() 函数在 SQL Server 中的强大功能。PARTITION BY 可以帮助我们将数据划分为多个逻辑分区,而 ROW_NUMBER() 则可以在每个分区内生成唯一的行号。结合使用这两个功能,可以轻松实现诸如分页、排名、去重等复杂的数据操作。希望本文的示例和解释能够帮助读者更好地理解和应用这些功能,从而提高数据处理的效率和准确性。

© 版权声明
THE END
喜欢就支持一下吧
点赞10 分享