pandas 第499页 - IT屋-程序员软件开发技术分享社区

根据条件合并行熊猫数据框

嗨，有一个数据框df 包含一组事件(行). df = pd.DataFrame(data=[[1, 2, 7, 10], [10, 22, 1, 30], [30, 42, 2, 10], [100,142, 22,1], [1 ..

发布时间：2020-05-24 01:59:15 python pandas dataframe Python

如何计算大熊猫groupby中的所有正值和负值?

假设我们有一张桌子: df = pd.DataFrame({'A' : ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'], 'B' : ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'], ..

发布时间：2020-05-24 01:59:11 python lambda pandas Python

从选定位置导入Python模块

假设我有三个脚本. Main.py(具有所有导入)，1.py(随机脚本)，2.py(随机脚本). pyinstaller -F --onedir Main.py (80mb) pyinstaller -F --onedir 1.py (80mb) pyinstaller -F --onedir 2.py (80mb) 这将创建3个文件夹，然后将1.exe和2.exe复制到具有所有依赖项的 ..

发布时间：2020-05-24 01:59:08 python pandas selenium compression pyinstaller Python

将pandas DataFrame行复制到其他多个行

简单实用的问题，但我找不到解决方法. 我看的问题如下: 修改熊猫数据框中的行的子集将某些值更改为多个一次熊猫数据框的列复制列的最快方法从一个DataFrame到另一个使用Pandas的数据框架? 从pandas.DataFrame中使用复杂条件进行选择这些和我的主要区别在于，我不需要插入单个值，而是插入一行. 我的问题是，我拿起一行数据框，例如df1 ..

发布时间：2020-05-24 01:59:05 python pandas Python

熊猫菲娜模式

我有一个数据集，其中有一个称为“本国"的列，其中包含30000条记录.有些缺少以NaN表示的内容，所以我想用mode()值填充它.我写了这样的东西: data['Native Country'].fillna(data['Native Country'].mode(), inplace=True) 但是，当我计算缺失值时: for col_name in data.columns: ..

发布时间：2020-05-24 01:59:03 python pandas fillna Python

我正在尝试在熊猫中快速创建一个模拟的随机游走系列. import pandas as pd import numpy as np dates = pd.date_range('2012-01-01', '2013-02-22') y2 = np.random.randn(len(dates))/365 Y2 = pd.Series(y2, index=dates) start_price = ..

发布时间：2020-05-24 01:59:01 python pandas random-walk Python

熊猫-每经度/纬度的数据组/箱

我有一堆如下的地理数据. 我想按经度.2度和纬度.2度的bin对数据进行分组. 对于纬度或经度而言，这都是微不足道的，那么对两个变量进行此操作最合适的是什么? |User_ID |Latitude |Longitude|Datetime |u |v | |---------|----------|---------|----------------- ..

发布时间：2020-05-24 01:58:58 python pandas binning Python

转置Pandas DataFrame并将列标题更改为列表

我有以下Pandas子数据框 col1 name1 name2 522 a 10 0.2 1021 b 72 -0.1 col1没有重复项.我想转置数据框并将列标题更改为col1值.理想情况下，输出应类似于 Variable a b name1 10 72 name2 0.2 - ..

发布时间：2020-05-24 01:58:56 python pandas Python

无法在熊猫条形图中调整x轴DateFormat

我希望使用matplotlib绘制一个熊猫时间序列对象data.对于简单的折线图data.plot()，我可以使用ax.xaxis.set_major_formatter(md.DateFormatter('%Y-%m-%d %H:%M:%S'))成功更改x轴日期格式. 但是，对于条形图data.plot(kind='bar')，我无法执行相同的操作.并且该图表不会显示.有没有办法更改熊猫条 ..

发布时间：2020-05-24 01:58:53 matplotlib pandas Python

具有列特定聚合功能的Pandas df.resample

使用 pandas.DataFrame.resample 我可以对DataFrame进行下采样: df.resample("3s", how="mean") 这将使用类似于日期时间的索引对数据帧进行重新采样，以使3秒内的所有值都汇总到一行中.列中的值是平均值. 问题:我有一个包含多列的数据框.是否可以为不同的列指定不同的聚合函数，例如我要"sum"列x，"mean"列y并为z列选择 ..

发布时间：2020-05-24 01:58:51 python pandas Python

格式化大熊猫数据框中的整数的千位分隔符

我正尝试使用'{:,}'.format(number)像下面的示例一样在熊猫数据框中格式化数字: # This works for floats and integers print '{:,}'.format(20000) # 20,000 print '{:,}'.format(20000.0) # 20,000.0 问题在于，具有整数的数据帧不起作用，而具有浮点数的数据帧可以正常工 ..

发布时间：2020-05-24 01:58:47 python pandas Python

熊猫替换列的子集的空值

我有一个包含许多列的数据框，例如: df: name salary age title John 100 35 eng Bill 200 NaN adm Lena NaN 28 NaN Jane 120 45 eng 我要替换薪水和年龄中的空值，但在其他列中不使用.我知道我可以做这样的事情: u ..

发布时间：2020-05-24 01:58:44 python pandas Python

熊猫滚动窗百分等级

我正在尝试在滚动窗口中按列计算数据的百分等级. test=pd.DataFrame(np.random.randn(20,3),pd.date_range('1/1/2000',periods=20),['A','B','C']) test Out[111]: A B C 2000-01-01 -0.566992 -1 ..

发布时间：2020-05-24 01:58:42 python pandas apply rank percentile Python

如何识别Python Pandas Dataframe中重复行的首次出现

我有一个Pandas DataFrame，其中的一组列具有重复的值.例如: df = pd.DataFrame({'Column1': {0: 1, 1: 2, 2: 3}, 'Column2': {0: 'ABC', 1: 'XYZ', 2: 'ABC'}, 'Column3': {0: 'DEF', 1: 'DEF', 2: 'DEF'}, 'Column4': {0: 10, 1: 4 ..

发布时间：2020-05-24 01:58:38 python-2.7 dataframe pandas Python

将从Excel读取的数据组织到Pandas DataFrame

此脚本的目标是: 1.从excel文件(> 100,000万行)中读取timseries数据以及标头(标签，单位) 2.将Excel数字日期转换为熊猫dataFrame的最佳日期时间对象 3.能够使用时间戳来引用行，使用系列标签来引用列到目前为止，我已使用xlrd将excel数据读取到列表中.用每个列表制作熊猫系列，并使用时间列表作为索引.将系列与系列标题结合使用，以制作python字典. ..

发布时间：2020-05-24 01:58:35 python excel pandas Python

排序大熊猫日期时间索引

我有一个要构建的熊猫日期时间索引.可能是由于整个构建过程中各个成员的顺序不正确.我想对索引进行排序.我应该有一个明显的方法吗? 到目前为止，我要做的是 import pandas as pd tseries = pd.to_datetime(['2001-02-04', '2013-08-14', '2008-01-25']) print 'original unsorted tser ..

发布时间：2020-05-24 01:58:33 python datetime pandas Python

重命名“无"；熊猫的价值

这可能是非常简单的，但我只是找不到答案.我使用GeoPandas从形状文件导入数据.把它变成熊猫DataFrame.我有一个包含三个字母代码和None值的对象字段，用于缺少数据.如何在熊猫中将None更改为"vcv"之类的内容?我尝试过了 sala.replace(None,"vcv") 遇到此错误 2400 ..

发布时间：2020-05-24 01:58:29 python pandas null rename Python

从索引交换一级到列级(Pandas Multiindex Dataframe)

我有一个多索引的pandas.Dataframe，就像这样: BAZ PAL Foo Bar 124 1 A B 2 C D 134 1 E F 2 G H 我需要以适当的方式将索引的一级交换为列.我需要结束这样的事情: 124 ..

发布时间：2020-05-24 01:58:27 python pandas Python

熊猫为每个字符拆分数据框列

我有多个看起来像这样的数据框列: Day1 0 DDDDDDDDDDBBBBBBAAAAAAAAAABBBBBBDDDDDDDDDDDDDDDD 1 DDDDDDDDDDBBBBBBAAAAAAAAAABBBBBBDDDDDDDDDDDDDDDD 2 DDDDDDDDDDBBBBBBAAAAAAAAAABBBBBBDDDDD ..

发布时间：2020-05-24 01:58:25 python pandas dataframe Python

大熊猫.iloc和.iat之间的区别?

我最近注意到，使用.iloc遍历DataFrame行的函数非常慢.我发现有一个叫做.iat的更快的方法，据说等效于.iloc.我尝试了一下，将运行时间减少了约75％. 但是我有点犹豫:为什么有一种更快的“等效"方法?两者的内部运作方式之间一定存在差异，并且它们之所以存在，而不仅仅是更快的原因，两者之间必须存在差异.我尝试到处寻找，但即使熊猫文档也指出了这一点 DataFrame.iat ..

发布时间：2020-05-24 01:58:23 python pandas dataframe Python

pandas相关内容