pandas相关内容

从选定位置导入Python模块

假设我有三个脚本. Main.py(具有所有导入),1.py(随机脚本),2.py(随机脚本). pyinstaller -F --onedir Main.py (80mb) pyinstaller -F --onedir 1.py (80mb) pyinstaller -F --onedir 2.py (80mb) 这将创建3个文件夹,然后将1.exe和2.exe复制到具有所有依赖项的 ..
发布时间:2020-05-24 01:59:08 Python

将pandas DataFrame行复制到其他多个行

简单实用的问题,但我找不到解决方法. 我看的问题如下: 修改熊猫数据框中的行的子集 将某些值更改为多个一次熊猫数据框的列 复制列的最快方法从一个DataFrame到另一个使用Pandas的数据框架? 从pandas.DataFrame中使用复杂条件进行选择 这些和我的主要区别在于,我不需要插入单个值,而是插入一行. 我的问题是,我拿起一行数据框,例如df1 ..
发布时间:2020-05-24 01:59:05 Python

熊猫菲娜模式

我有一个数据集,其中有一个称为“本国"的列,其中包含30000条记录.有些缺少以NaN表示的内容,所以我想用mode()值填充它.我写了这样的东西: data['Native Country'].fillna(data['Native Country'].mode(), inplace=True) 但是,当我计算缺失值时: for col_name in data.columns: ..
发布时间:2020-05-24 01:59:03 Python

大熊猫

我正在尝试在熊猫中快速创建一个模拟的随机游走系列. import pandas as pd import numpy as np dates = pd.date_range('2012-01-01', '2013-02-22') y2 = np.random.randn(len(dates))/365 Y2 = pd.Series(y2, index=dates) start_price = ..
发布时间:2020-05-24 01:59:01 Python

熊猫-每经度/纬度的数据组/箱

我有一堆如下的地理数据. 我想按经度.2度和纬度.2度的bin对数据进行分组. 对于纬度或经度而言,这都是微不足道的,那么对两个变量进行此操作最合适的是什么? |User_ID |Latitude |Longitude|Datetime |u |v | |---------|----------|---------|----------------- ..
发布时间:2020-05-24 01:58:58 Python

无法在熊猫条形图中调整x轴DateFormat

我希望使用matplotlib绘制一个熊猫时间序列对象data.对于简单的折线图data.plot(),我可以使用ax.xaxis.set_major_formatter(md.DateFormatter('%Y-%m-%d %H:%M:%S'))成功更改x轴日期格式. 但是,对于条形图data.plot(kind='bar'),我无法执行相同的操作.并且该图表不会显示.有没有办法更改熊猫条 ..
发布时间:2020-05-24 01:58:53 Python

具有列特定聚合功能的Pandas df.resample

使用 pandas.DataFrame.resample 我可以对DataFrame进行下采样: df.resample("3s", how="mean") 这将使用类似于日期时间的索引对数据帧进行重新采样,以使3秒内的所有值都汇总到一行中.列中的值是平均值. 问题:我有一个包含多列的数据框.是否可以为不同的列指定不同的聚合函数,例如我要"sum"列x,"mean"列y并为z列选择 ..
发布时间:2020-05-24 01:58:51 Python

格式化大熊猫数据框中的整数的千位分隔符

我正尝试使用'{:,}'.format(number)像下面的示例一样在熊猫数据框中格式化数字: # This works for floats and integers print '{:,}'.format(20000) # 20,000 print '{:,}'.format(20000.0) # 20,000.0 问题在于,具有整数的数据帧不起作用,而具有浮点数的数据帧可以正常工 ..
发布时间:2020-05-24 01:58:47 Python

熊猫替换列的子集的空值

我有一个包含许多列的数据框,例如: df: name salary age title John 100 35 eng Bill 200 NaN adm Lena NaN 28 NaN Jane 120 45 eng 我要替换薪水和年龄中的空值,但在其他列中不使用.我知道我可以做这样的事情: u ..
发布时间:2020-05-24 01:58:44 Python

将从Excel读取的数据组织到Pandas DataFrame

此脚本的目标是: 1.从excel文件(> 100,000万行)中读取timseries数据以及标头(标签,单位) 2.将Excel数字日期转换为熊猫dataFrame的最佳日期时间对象 3.能够使用时间戳来引用行,使用系列标签来引用列 到目前为止,我已使用xlrd将excel数据读取到列表中.用每个列表制作熊猫系列,并使用时间列表作为索引.将系列与系列标题结合使用,以制作python字典. ..
发布时间:2020-05-24 01:58:35 Python

排序大熊猫日期时间索引

我有一个要构建的熊猫日期时间索引.可能是由于整个构建过程中各个成员的顺序不正确.我想对索引进行排序.我应该有一个明显的方法吗? 到目前为止,我要做的是 import pandas as pd tseries = pd.to_datetime(['2001-02-04', '2013-08-14', '2008-01-25']) print 'original unsorted tser ..
发布时间:2020-05-24 01:58:33 Python

重命名“无";熊猫的价值

这可能是非常简单的,但我只是找不到答案.我使用GeoPandas从形状文件导入数据.把它变成熊猫DataFrame.我有一个包含三个字母代码和None值的对象字段,用于缺少数据.如何在熊猫中将None更改为"vcv"之类的内容?我尝试过了 sala.replace(None,"vcv") 遇到此错误 2400 ..
发布时间:2020-05-24 01:58:29 Python

大熊猫.iloc和.iat之间的区别?

我最近注意到,使用.iloc遍历DataFrame行的函数非常慢.我发现有一个叫做.iat的更快的方法,据说等效于.iloc.我尝试了一下,将运行时间减少了约75%. 但是我有点犹豫:为什么有一种更快的“等效"方法?两者的内部运作方式之间一定存在差异,并且它们之所以存在,而不仅仅是更快的原因,两者之间必须存在差异.我尝试到处寻找,但即使熊猫文档也指出了这一点 DataFrame.iat ..
发布时间:2020-05-24 01:58:23 Python