本文介绍了函数在多索引 pandas 数据帧中的应用的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
这是我正在处理的DataFrame的示例:
df = pd.DataFrame(
index=pd.MultiIndex.from_tuples(
[('Monday', '2019-11-04'),('Monday', '2019-11-11'), ('Monday', '2019-11-18'),
('Tuesday', '2019-11-05'), ('Tuesday', '2019-11-12'), ('Tuesday', '2019-11-19'),
('Wednesday', '2019-11-06'), ('Wednesday', '2019-11-13'), ('Wednesday', '2019-11-20'),
( 'Thursday', '2019-11-07'), ('Thursday', '2019-11-14'), ('Thursday', '2019-11-21'),
('Friday', '2019-11-01'), ('Friday', '2019-11-08'), ('Friday', '2019-11-15'),
('Saturday', '2019-11-02'), ('Saturday', '2019-11-09'), ('Saturday', '2019-11-16'),
('Sunday', '2019-11-03'), ('Sunday', '2019-11-10'), ('Sunday', '2019-11-17')]),
data={'A': [363287, 348759, 295711, 346276, 350785, 292794, 328048, 315418,
303901, 324330, 302850, 308500, 415665, 324196, 289739, 444184,
361214, 359573, 436543, 375668, 379184],
'B': [263641, 293827, 272811, 267064, 307886, 269061, 266336, 292442,
273714, 268377, 278113, 270378, 268556, 274989, 268869, 312046,
321059, 322694, 323546, 332234, 333341],
'C': [263678, 293870, 272855, 267092, 307931, 269114, 266378, 292488,
273769, 268426, 278156, 270422, 268602, 275021, 268906, 312084,
321116, 322741, 323602, 332298, 333405]})
现在,我正在通过使用for循环对每列应用scipy.stats.zscore
来获取每列中每个值的zcore:
在应用zcore函数时,不考虑每列中的所有数字,而是如何在应用该函数之前按索引的第一级(星期几)进行分组?例如,我想首先对
df.loc[('Monday'), 'A']
中的值应用该函数,然后对
df.loc[('Tuesday'), 'A']
中的值应用该函数,依此类推。
还有,有没有一种方法可以不涉及将DataFrame的子集追加到列表中,然后在处理它们后将它们连接起来。
谢谢!
推荐答案
使用Groupby.transform
:
此GROUP BY LEVEL=0索引(星期一,星期二...)
或者如果要重命名索引
这篇关于函数在多索引 pandas 数据帧中的应用的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!