附加在 for 循环中生成的 Pandas 数据帧 [英] Appending pandas dataframes generated in a for loop

查看:40
本文介绍了附加在 for 循环中生成的 Pandas 数据帧的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我在 for 循环中访问一系列 Excel 文件.然后我将 excel 文件中的数据读取到 Pandas 数据框.我不知道如何将这些数据帧附加在一起,然后将数据帧(现在包含来自所有文件的数据)保存为一个新的 Excel 文件.

I am accessing a series of Excel files in a for loop. I then read the data in the excel file to a pandas dataframe. I cant figure out how to append these dataframes together to then save the dataframe (now containing the data from all the files) as a new Excel file.

这是我尝试过的:

for infile in glob.glob("*.xlsx"):
    data = pandas.read_excel(infile)
    appended_data = pandas.DataFrame.append(data) # requires at least two arguments
appended_data.to_excel("appended.xlsx")

谢谢!

推荐答案

使用 pd.concat 将 DataFrame 列表合并为一个大 DataFrame.

Use pd.concat to merge a list of DataFrame into a single big DataFrame.

appended_data = []
for infile in glob.glob("*.xlsx"):
    data = pandas.read_excel(infile)
    # store DataFrame in list
    appended_data.append(data)
# see pd.concat documentation for more info
appended_data = pd.concat(appended_data)
# write DataFrame to an excel sheet 
appended_data.to_excel('appended.xlsx')

这篇关于附加在 for 循环中生成的 Pandas 数据帧的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆