首页
Python
Python-根据每个项目的位置将文本解析为多个列

Python-根据每个项目的位置将文本解析为多个列 [英] Python - Parsing a text onto columns by the position of each item

查看：0 发布时间：2022/8/4 14:35:15 python pandas jupyter bigdata

本文介绍了Python-根据每个项目的位置将文本解析为多个列的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

巴西证券交易所(Bovespa)提供了一个文件，其中包含一个时间框架内的所有报价。文件太大，每一行都类似于这个真实的示例：

数据-lang="js"数据-隐藏="假"数据-控制台="真"数据-巴贝尔="假">

012016010402AAPL34      010APPLE       DRN          R$  000000000415000000000042200000000004150000000000421300000000042080000000003950000000000435000005000000000000012500000000000052664400000000000000009999123100000010000000000000BRAAPLBDR004115

因此，在查找文档时，我发现列映射如下：

char 01到02：(Int)寄存器类型；
char 03-10：(日期)股票报价信息日期；
char 11至12：(Int)某种代码；
char 13至24：(Str)股票代码；
...

我开始学习Python，并尝试读取包含此数据的文件，并使用以下代码成功地完成了每一行：

数据-lang="js"数据-隐藏="假"数据-控制台="假"数据-巴贝尔="假">

import pandas as pd
dataset1 = pd.read_table('bmfbovespaquotes/DemoCotacoesHistoricas12022003.txt')

我认为这可能是一个愚蠢的问题，但我还没有找到解决方案，所以如果你知道解决这个问题的方法，请分享。

谢谢

推荐答案

您有一个fiXedidformat：这样可以解决问题。

pd.read_fwf(file_path, widths=[...], names=[...])

您应该传递宽度列表(在本例中以[2,8,2,10,...]开头)和列列表['register','date','code','ticker',...]

这篇关于Python-根据每个项目的位置将文本解析为多个列的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持IT屋！

查看全文

相关文章

Python-将文本文件解析为csv文件;

将单个列解析为多个;

JComboBox中每个项目的多个颜色;

Python-根据列值将数据框分为多个数据框，并用这些值命名;

Java-根据列将CSV解析为数组;

根据项目和子项目的文本查找ListView项目;

python-为Keras LSTM读取多个CSV;

Java - 根据列将CSV解析为Hashmap和Arraylist;

Python-具有多个时区的pandas datetime列;

Python-有效检查列表中的每个项目与其他所有项目;

Python-根据列的最大值删除重复项;

python-根据列中的值重复行x次;

Python-将datetime列转换为秒;

Python-根据条件调用函数;

Openrefine-根据文本将行转置为列;

PySpark根据名称将列表分解为多个列;

Python为每个项目创建变量;

如何限制具有多个随机选择位置的项目，以使每个项目的平均位置在一定范围内;

创建具有多个解析的项目的Scrapy数组;

将多个用户ID添加到特定项目的列中;

组合框上每个项目的工具提示，文本被剪切;

用木偶的CollectionView创建每个项目的多个视图;

python-根据部分字符串在列表中查找索引位置;

每个项目的单独代码;

每个枚举项目的编号？;

Python最新文章

类型错误：只有长度为1的阵列可以尝试拟合指数的数据转换到Python标量;

bs4.FeatureNotFound：找不到一棵树建设者您所要求的功能：LXML。你需要安装一个解析器库？;

系列的真值是不明确的。使用a.empty，a.bool（），a.item（），a.any（）或a.all（）;

（unicode错误）'unicodeescape'编解码器无法解码位置2-3中的字节：truncated \UXXXXXXXX escape;

将pandas dataframe中的列从int转换为string;

Python：由实例对象调用方法：“missing 1 required positional argument：'self'”;

Sparksql过滤与多个条件（与where子句中选择）;

JSONDe codeError：期待值：1行1列（CHAR 0）;

Cmake不能找到Python库;

Python - 将Dataframe中的所有项目转换为字符串;

热门教程

Java教程

Apache ANT 教程

Kali Linux教程

JavaScript教程

JavaFx教程

MFC 教程

Apache HTTP客户端教程

Microsoft Visio 教程

热门工具

Java 在线工具

C(GCC) 在线工具

PHP 在线工具

C# 在线工具

Python 在线工具

MySQL 在线工具

VB.NET 在线工具

Lua 在线工具

Oracle 在线工具

C++(GCC) 在线工具

Go 在线工具

Fortran 在线工具

登录关闭

扫码关注1秒登录

发送“验证码”获取 | 15天全站免登陆

友情链接： IT屋 Chrome插件谷歌浏览器插件

IT屋 ©2016-2022 琼ICP备2021000895号-1 站点地图站点标签 SiteMap <免责申明> 本站内容来源互联网,如果侵犯您的权益请联系我们删除.