ermutuxia

2020-10-28   阅读量: 510

python 中数据框对象如何生成组内秩?也就是组内排名

扫码加入数据分析学习群
#python 中数据框对象如何生成组内秩?也就是组内排名
import pandas as pd
data=pd.DataFrame(data=[["张三",30],
                          ["李四",30],
                          ["张三",20],
                          ["李四",25]],columns=["姓名","分数"])


image.png



data.sort_values(by=["姓名","分数"],inplace=True)

image.png

data["总体秩"]=pd.Series(range(len(data["分数"])),index=data.index)


image.png



data["groupmin总体秩"]=data["总体秩"].groupby([data["姓名"]]).transform(np.min)


image.png

data["组内秩"]=data["总体秩"]-data["groupmin总体秩"]+1


image.png

到此完成组内秩的计算过程。下面给出连续完整代码如下:

#python 中数据框对象如何生成组内秩?也就是组内排名

import pandas as pd
data=pd.DataFrame(data=[["张三",30],
                          ["李四",30],
                          ["张三",20],
                          ["李四",25]],columns=["姓名","分数"])
data.sort_values(by=["姓名","分数"],inplace=True)
data["总体秩"]=pd.Series(range(len(data["分数"])),index=data.index)
data["groupmin总体秩"]=data["总体秩"].groupby([data["姓名"]]).transform(np.min)
data["组内秩"]=data["总体秩"]-data["groupmin总体秩"]+1











0.0041 3 0 关注作者 收藏

评论(0)


暂无数据

推荐课程