如何将空间单独的文件加载到 pandas 数据框中? [英] How to load space separate file into pandas dataframe?

查看:49
本文介绍了如何将空间单独的文件加载到 pandas 数据框中?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我想将空格分隔的数据加载到 Pandas 数据框中.如果我使用 sep='\s+',则会收到错误 CParserError: Error tokenizing data.C 错误:第 5 行应为 7 个字段,看到 9 个

I want to load a space separated data into pandas dataframe. If I use sep='\s+', then I get the error CParserError: Error tokenizing data. C error: Expected 7 fields in line 5, saw 9

df = pd.read_table("data.rpt",sep='\s+',index_col=False)

我能够使用空格作为分隔符在 Excel 中打开此文件.如何用熊猫解决这个问题?

I was able to open this file in Excel using space as a delimiter. How to solve this issue with pandas?

文件的第一行:

Id IdEvent  Agent   Sist  Group   Con CInt
-- -------  -----   ----  -----   --- ----
18 2016101  B0C     XCX   ROD F   DC  0
19 2016101  A0C     DCX   APT     AD  5
15 2016103  V0C     XCX   ROD S   DC  0
16 2016102  N0C     XCX   ROD     CD  0

推荐答案

使用 read_fwf() 方法:

In [125]: pd.read_fwf(fn, skiprows=[1])
Out[125]:
   Id  IdEvent Agent Sist  Group Con  CInt
0  18  2016101   B0C  XCX  ROD F  DC     0
1  19  2016101   A0C  DCX    APT  AD     5
2  15  2016103   V0C  XCX  ROD S  DC     0
3  16  2016102   N0C  XCX    ROD  CD     0

这篇关于如何将空间单独的文件加载到 pandas 数据框中?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆