学习pandas apply方法，看这一篇就够了，你该这么学，No.10

栏目: 数据库 · 发布时间: 7年前

内容简介：对于有些数据类型来说是的，有些agg与transform 不是很适合所以就会出现apply方法不过哪些不适合，我们要慢慢细说啦

对于有些数据类型来说是的，有些

agg与transform 不是很适合所以就会出现apply方法

不过哪些不适合，我们要慢慢细说啦

首先，我们先弄几个apply的例子，看看它到底能干啥

要测试，先造数据

import pandas as pd

df = pd.DataFrame({'A':['bob','sos','bob','sos','bob','sos','bob','bob'],
              'B':['one','one','two','three','two','two','one','three'],
              'C':[3,1,4,1,5,9,2,6],
              'D':[1,2,3,4,5,6,7,8]})
复制代码

数据造好，分组开始

grouped = df.groupby('A')

for name,group in grouped:
    print(name)
    print(group)
复制代码

要想成为高手，这时候，你要开始写代码了

千万不能只看着

对的，你看着永远学不会的

相信橡皮擦

然后我们对结果应用apply方法

d = grouped.apply(lambda x:x.describe())
print(d)
复制代码

lambda表达式，自己去百度下，关键字python lambda 就是个匿名函数，没啥难的

给分组之后的数据，同时应用 describe方法

当当当，结果展示为

对于apply()方法来说，它做了这么一个操作将groupby分组好的数据，一组，一组，一组的传递到了函数里面

看好是一组，一组的传递进去

所以，呈现出一种多层级的结构

很难理解，是吧

没错，就是不好理解，要不难么

给你弄个图，理解理解

什么，还不理解

那这样，我们获取分组之后的前2条数据

新需求哦~

完整代码

import pandas as pd

df = pd.DataFrame({'A':['bob','sos','bob','sos','bob','sos','bob','bob'],
              'B':['one','one','two','three','two','two','one','three'],
              'C':[3,1,4,1,5,9,2,6],
              'D':[1,2,3,4,5,6,7,8]})


grouped = df.groupby('A')

for name,group in grouped:
    print(name)
    print(group)

d = grouped.apply(lambda x:x.head(2))
复制代码

你看看出来的数据

晓得了不，apply方法会将分组后的数据一起传入可以返回多维数据

厉害，厉害，虽然一般我只用最简单的

不用lambda，咱们在实现一下，可能更清楚一些

代码呢，你可以改成这个样子

def get_top(df):
    return df.head(2)

d = grouped.apply(get_top)
复制代码

看，像高手的两把刷子了吧

然后，你还可以给传个参数进去

def get_top(df,n):
    return df.head(n)

d = grouped.apply(get_top,n=3)

print(d)
复制代码

apply方法也可以应用在series上面

自己去试试吧

最后，我需要一个使用apply最常用

也是最好用的方法

当然pandas这么厉害

肯定有很多办法可以替代的

填补空值

import pandas as pd

df = pd.DataFrame({'A':['bob','sos','bob','sos','bob','sos','bob','bob'],
              'B':['one','one','two','three','two','two','one','three'],
              'C':[3,1,4,1,5,9,None,6],
              'D':[1,2,3,None,5,6,7,8]})


grouped = df.groupby('A')

for name,group in grouped:
    print(name)
    print(group)

def fill_none(one_group):
   return one_group.fillna(one_group.mean()) # 把平均值填充到空值里面


d = grouped.apply(fill_none)
print(d)
复制代码

完美，对应一下数据瞅瞅