chained-assignment相关内容
我一直在阅读这个 链接 关于“返回视图与副本".我真的不明白 Pandas 中的 chained assignment 概念是如何工作的,以及 .ix()、.iloc() 或.loc() 会影响它. 我收到以下代码行的 SettingWithCopyWarning 警告,其中 data 是 Panda 数据框,amount 是一列(系列)该数据框中的名称: data['amount'] =
..
我喜欢 pandas 并且已经使用它多年,并且非常有信心我可以很好地处理如何对数据帧进行子集化以及如何适当地处理视图与副本(尽管我使用了很多断言来确定).我也知道有很多关于 SettingWithCopyWarning 的问题,例如如何处理 Pandas 中的 SettingWithCopyWarning?以及一些关于在它发生时绕着你的头的最新指南,例如了解熊猫中的 SettingWithCopy
..
我对 Pandas 在决定数据帧中的选择是原始数据帧的副本还是原始数据帧的视图时使用的规则感到困惑. 如果我有,例如, df = pd.DataFrame(np.random.randn(8,8), columns=list('ABCDEFGH'), index=range(1,9)) 我知道 query 会返回一个副本,因此类似于 foo = df.query('2
..
我一直在阅读这个链接 关于“返回视图与副本".我真的不明白 Pandas 中 chained assignment 概念是如何工作的,以及如何使用 .ix()、.iloc() 或.loc() 影响它. 我收到以下代码行的 SettingWithCopyWarning 警告,其中 data 是 Panda 数据框,amount 是一列(系列)该数据框中的名称: data['amount']
..
从父数据帧中选择子数据帧时,我注意到一些程序员使用 .copy() 方法制作数据帧的副本.例如, X = my_dataframe[features_list].copy() ...而不仅仅是 X = my_dataframe[features_list] 他们为什么要复制数据框?如果我不制作副本会怎样? 解决方案 这扩展了 Paul 的回答.在 Pandas 中,索引 DataF
..
我有以下索引 DataFrame,其中命名的列和行不是连续数字: a b c d2 0.671399 0.101208 -0.181532 0.2412733 0.446172 -0.243316 0.051767 1.5773185 0.614758 0.075793 -0.451460 -0.012493 我想在现有数据框中添加一个新列 'e' 并且不想更改数据框中的任何内容(即,新列始
..
背景 我刚刚将 Pandas 从 0.11 升级到 0.13.0rc1.现在,该应用程序弹出了许多新警告.其中之一是这样的: E:\FinReporter\FM_EXT.py:449: SettingWithCopyWarning: 试图在 DataFrame 的切片副本上设置一个值.尝试使用 .loc[row_index,col_indexer] = value 代替quote_df['
..
我有一大块代码,在某个地方,在 Pandas 中生成带有复制警告的设置(这个问题). 我知道如何解决问题,但我找不到它是什么行号!有没有办法取消行号(除了调试步进或放入多个打印的蛮力方法之外)?我得到的唯一输出是下面的,它没有进入我的代码堆栈: C:\Anaconda3\lib\site-packages\pandas\core\frame.py:2302: SettingWithCopy
..
背景 我刚刚将熊猫从0.11升级到0.13.0rc1。现在,该应用程序会弹出许多新警告。像这样的一个: E:\FinReporter\FM_EXT.py:449:SettingWithCopyWarning:正在尝试在来自DataFrame的切片的副本。 尝试使用.loc [row_index,col_indexer] =值代替 quote_df ['TVol'] = quote
..
我正在使用python和诸如pandas和scipy之类的多个库来准备数据,因此我可以开始更深入的分析.例如,出于准备目的,我将创建两个日期不同的新列. 我的代码提供了预期的结果,但速度确实很慢,因此我无法将其用于具有80K行的表.运行时间大约需要只需80分钟的时间即可完成此表格的操作. 问题肯定与我的写作操作有关: tableContent[6]['p_test_Duration'
..
我试图将早于1900年的电子表格的“日期"列中的所有日期值更改为今天的日期,所以我有一个切面. 编辑:前几行代码: df=pd.read_excel(filename)#,usecols=['NAME','DATE','EMAIL'] #regex to remove weird characters df['DATE'] = df['DATE'].str.replace(r'[^a-
..
我的代码的以下行会引发警告: import pandas as pd s = pd.DataFrame(np.random.randint(0,100,size=(100, 4)), columns=list('ABCD')) s.loc[-1] = [5,np.nan,np.nan,6] grouped = s.groupby(['A']) for key_m, group_m in g
..
如何将数据框给定列的每个元素与标量相乘? (我曾尝试过寻找SO,但似乎找不到正确的解决方案) 做类似的事情: df['quantity'] *= -1 # trying to multiply each row's quantity column with -1 给我一个警告: A value is trying to be set on a copy of a slic
..
我喜欢熊猫,并且已经使用了多年,并且感到非常自信,我对如何对数据帧进行子集处理以及如何适当地处理视图和副本(尽管我使用很多断言可以肯定)有很好的把握.我也知道,关于SettingWithCopyWarning的问题很多,例如如何在熊猫中处理SettingWithCopyWarning? 以及最近一些很棒的指南,例如在发生问题时将头围起来. 了解熊猫的SettingWithCopyWarning .
..
我有一个pandas数据框:数据.它具有列["name",'A','B'] 我想做的(可行的)是: d2 = data[data['name'] == 'fred'] #This gives me multiple rows d2['A'] = 0 这会将表行的A列设置为0. 我也做了: indexes = d2.index data['A'][indexes] = 0
..
是否有一种简单的方法来检查两个数据帧是否是不涉及操作的同一基础数据的不同副本或视图?我正在尝试掌握每一个生成的时间,并且鉴于规则看起来有多特殊,我想要一种简单的测试方法. 例如,我认为"id(df.values)"在各个视图中都将是稳定的,但它们似乎并非如此: # Make two data frames that are views of same data. df = pd.Dat
..
我已经浏览了与该问题相关的一堆问题和答案,但是我仍然发现我在意想不到的地方得到了切片警告的副本.另外,它的代码在以前对我来说运行良好,这使我想知道某种更新是否可能是罪魁祸首. 例如,这是一组代码,其中我要做的就是将Excel文件读入熊猫DataFrame,并减少df[[]]语法中包含的列集. izmir = pd.read_excel(filepath) izmir_lim = i
..
我有一个带有4列的pandas DataFrame,我想创建一个 new Dataframe,它仅 具有三列.这个问题类似于:从数据框中提取特定列,但是下面的代码不起作用,会引发错误,并且肯定不是熊猫的方式. import pandas as pd old = pd.DataFrame({'A' : [4,5], 'B' : [10,20], 'C' : [100,50], 'D' : [-
..
我想用NaN替换大于任意数(在这种情况下为100)的Pandas DataFrame中的值(因为该值太大表示实验失败).以前,我使用它来替换不需要的值: sve2_all[sve2_all[' Hgtot ng/l'] > 100] = np.nan 但是,出现以下错误: -c:3: SettingWithCopyWarning: A value is trying to be s
..
起初,我尝试编写一些看起来像这样的代码: import numpy as np import pandas as pd np.random.seed(2016) train = pd.DataFrame(np.random.choice([np.nan, 1, 2], size=(10, 3)), columns=['Age', 'SibSp',
..