◆◆◆ ◆◆
前言
数据的行转列操作,在实际工作过程中应用非常广泛。
由于不同人员、不同部门对数据结构的认识是不大相同的,尤其是从基层人员手里拿到的数据,更是五花八门,横七竖八。
比如有这样一张成绩表:
乍一看,好像没毛病啊!!
然鹅鹅鹅,当需求:=简单计算一下每个人的总分吧!来临的时候。我脑海中不禁浮想起了:
安排
# 遇事不要慌,先导个包吧
import pandas as pd
import numpy as np
# 造假数据
data = {'name':['严小样儿','严小样儿','严小样儿','才华横竖都溢','才华横竖都溢','才华横竖都溢','幽兰幽香','幽兰幽香','幽兰幽香'],
'subject':['Python','C','SQL','Python','C','SQL','Python','C','SQL'],
'score':[95,60,95,96,95,80,99,94,88]}
# 生成df
df = pd.DataFrame(data)
df
使用pivot方法即可完成行转列哦~语法如下:
#df.pivot(index=None, columns=None, values=None)
df.pivot(index='name',columns='subject',values='score')
不要高兴的太早,遇到重复值就麻烦了!少侠请看:
# 造含有重复值的假数据
data1 = {'name':['严小样儿','严小样儿','严小样儿','严小样儿','才华横竖都溢','才华横竖都溢','才华横竖都溢','幽兰幽香','幽兰幽香','幽兰幽香'],
'subject':['Python','Python','C','SQL','Python','C','SQL','Python','C','SQL'],
'score':[95,95,60,95,96,95,80,99,94,88]}
df1 = pd.DataFrame(data1)
df1
df1.pivot(index='name',columns='subject',values='score')
# 一旦有重复值,就会报错。
ValueError: Index contains duplicate entries, cannot reshape
别急别急,去个重不就可以了吗?!
df1.drop_duplicates().pivot(index='name',columns='subject',values='score')
方法二:数据透视表
# pivot_table(data, values=None, index=None, columns=None, aggfunc='mean')
pd.pivot_table(df1,index='name',columns='subject',values='score',aggfunc={'score':'max'})
聚合
刚刚说了,要求每个人的总分,其实使用透视表就可以完成。
不过,稍微动动脑筋哦。遇到重复值数据的话,只能使用下面的方法一行转列,去重后的数据集,方法一,二都支持。
计算每个人的总分,语法如下:
# 重复数据集也可以
df_pivot = pd.pivot_table(df1,index='name',columns='subject',values='score',aggfunc={'score':'max'})
# 增加一个新列:Total
df_pivot['Total'] = df_pivot.apply(lambda x:np.sum(x),axis = 1)
df_pivot
方法二,必须是去重后的数据集,否则会出现计算错误。
# 使用去重数据集才可以
pd.pivot_table(df,index='name',values='score',aggfunc='sum')
# 使用join方法把总分列加进去。
total = pd.pivot_table(df,index='name',values='score',aggfunc='sum')
pd.pivot_table(df,index='name',columns='subject',values='score').join(total)
–需求方:算是算出来了,可是行转列,这个score看着怪怪的,能不能改成“总分”呢?
–严小样儿:我改(卑微)!安排~
total1 = pd.pivot_table(df,index='name',values='score',aggfunc='sum').rename({'score':'总分'},axis=1)
pd.pivot_table(df,index='name',columns='subject',values='score').join(total1)
行转列,就这样讲完了,大家赶快动手实践一下吧。那么,如何列转行呢?!
提供300分钟视频讲解,教学大纲、课件、教案、习题答案、程序源码等配套资源。
扫码,优惠购书
凡是在京东购书的用户,可以将订单信息和评价发到itbook8@163.com,将会获取超值大礼包(包括案例源码,超多的视频教程,数据集等资源)
限时特惠:本站每日持续更新海量展厅资源,一年会员只需29.9元,全站资源免费下载
站长微信:zhanting688
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。