这篇文章主要介绍“Python中Dataframe元素为不定长list时的问题怎么解决”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“Python中Dataframe元素为不定长list时的问题怎么解决”文章能帮助大家解决问题。
引言
本文想要解决的问题是当DataFrame中某一列元素为不定长度的数组时,该如何对它们进行拆分分解为后续元素,从而进行进一步的提取操作,数据格式见下图:
解决方法
这个问题的解决思路首先是要不定长的数组填充成等长的数组,从而后续可以直接转换为元素为单一值的标准DataFrame,再和原DataFrame合并即可完成操作。填充的部分使用了map()
方法来实现,实现前还需要获得数组的最大长度以确定填充数目。代码见下:
a=[[['a','d'],['b'],['a','c']],[1,2,3],[4,5,6]]df=pd.DataFrame(a).Tused_col=df[0]length=used_col.map(lambda x:len(x))max_l=length.max()temp=used_col.map(lambda x:x+[np.nan]*(max_l-len(x)))temp=np.array(temp.to_list())temp=pd.DataFrame(temp)df=df.drop(0,axis=1)temp.columns=['cat1','cat2']output=df.join(temp)
结果展示:
pd.DataFrame(a).T
Out[13]:
0 1 2
0 [a, d] 1 4
1 [b] 2 5
2 [a, c] 3 6
output
Out[14]:
1 2 cat1 cat2
0 1 4 a d
1 2 5 b nan
2 3 6 a c
关于“Python中Dataframe元素为不定长list时的问题怎么解决”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识,可以关注编程网行业资讯频道,小编每天都会为大家更新不同的知识点。