fillna相关内容
我想根据提交的列的值替换缺少的值。 查找以下我拥有的内容:
..
我想使用 fillna 方法用另一列中的值填充一列中的缺失值. (我读到循环遍历每一行将是非常糟糕的做法,最好一次性完成所有事情,但我无法找到如何使用 fillna 来做到这一点.) 之前的数据: Day Cat1 Cat21只猫鼠2 狗象3只猫长颈鹿4 南蚂蚁 之后的数据: Day Cat1 Cat21只猫鼠2 狗象3只猫长颈鹿4 蚂蚁 解决方案 您可以将此列提供给 fil
..
这应该很简单,但我发现最接近的是这篇文章:pandas:在组内填充缺失值,我仍然可以't解决我的问题.... 假设我有以下数据框 df = pd.DataFrame({'value': [1, np.nan, np.nan, 2, 3, 1, 3, np.nan, 3], 'name': ['A','A', 'B','B','B','B', 'C','C','C']})名称值0 一 11
..
我有一个数据框,其中包含 year 和 type 的一些值.我想用特定类型的当年值的平均值替换每年的所有 NaN 值.我想以最优雅的方式做到这一点.我正在处理大量数据,因此减少计算也会有好处. 示例: df =pd.DataFrame({'year':[1,1,1,2,2,2],'类型':[1,1,2,1,1,2],'val':[np.nan,5,10,100,200,np.nan]})
..
我在包含来自其他列的一些缺失值的数据框中有一个名为 null 的奇怪列.一列是名为 location 的经纬度坐标,另一列是一个整数,表示名为 level 的目标变量.在location 或level 缺少值的某些但不是所有情况下,应该存在的值位于此null 列中.这是一个示例 df: pd.DataFrame({'null':{0:'43.70477575,-72.28844073',1:'2
..
我正在运行 Python 3.5 和 Pandas v 0.19.2.我有一个如下所示的数据框.向前填充缺失值很简单. 将pandas导入为pd将 numpy 导入为 npd = {'A': np.array([10, np.nan, np.nan, -3, np.nan, 4, np.nan, 0]),'B': np.array([np.nan, np.nan, 5, -3, np.nan,
..
给定一个 pd.Series,我想用一个列表替换空值.也就是说,给定: 将 numpy 导入为 np将熊猫导入为 pdser = pd.Series([0,1,np.nan]) 我想要一个可以返回的函数 0 01 12 [楠] 但是如果我尝试为此使用自然函数,即 fillna: result = ser.fillna([np.nan]) 但我收到错误 TypeError: "va
..
假设我有一个看起来像这样的数据框: df = 0 1 2 0 1.0 2.0 3.0 1 4.0 5.0 NaN 2 6.0 NaN NaN 然后可以使用 df.fillna(method ='ffill',axis = 1)来获得: 0 1 2 0 1.0 2.0 3.0 1 4.0 5.0 5.0 2 6.0 6.0 6.0
..
我有一个带有2列的Pandas DataFrame:Year(int)和Condition(string).在“条件"列中,我有一个nan值,我想根据groupby操作的信息替换它. import pandas as pd import numpy as np year = [2015, 2016, 2017, 2016, 2016, 2017, 2015, 2016, 2015, 20
..
我有一个数据框,其中有一列连续但不相邻的数字和缺失值. 我想使用fillna函数用前一个非缺失行的增量值来填充缺失值. 这是一个简化的表: index my_counter 0 1 1 2 2 NaN 3 3 4 NaN 5 NaN 6 8 我想这样填写my_counter: index my_c
..
说明:两个功能均属于类别dtypes.我在相同的不同内核中使用了此代码 dateset工作正常,唯一的区别是功能在flote64中.后来我已经将这些功能dtypes转换为Categorical 因为数据集中的所有要素都代表类别. 下面是代码: AM_train['product_category_2'].fillna('Unknown', inplace =True) AM_train
..
我有一个数据集,我想用bfill并在其中添加一个字符串来填充"value"列中的缺失数据.这是我拥有的代码: import pandas as pd import numpy as np df = pd.DataFrame( { 'category': ['X', 'X', 'X', 'X', 'X', 'X', 'Y', 'Y', 'Y'], 'n
..
对于初学者来说,这是一些适合我的问题的人工数据: df = pd.DataFrame(np.random.randint(0, 100, size=(vsize, 10)), columns = ["col_{}".format(x) for x in range(10)], index = range(0, vsize * 3, 3)) df_
..
这是我的输入内容: import pandas as pd import numpy as np list1 = [10,79,6,38,4,557,12,220,46,22,45,22] list2 = [4,3,23,6,234,47,312,2,426,42,435,23] df = pd.DataFrame({'A' : list1, 'B' : list2}, columns
..
我有一个数据框问题数据,在某些单元格中具有NaN值.我运行了以下代码. problem_data[problem_data['level_type'] == 5.0] 结果是这样: problem_id level_type points tags 5 prob_1479 5.0 NaN NaN 31 prob_2092
..
我有一个数据集,其中有一个称为“本国"的列,其中包含30000条记录.有些缺少以NaN表示的内容,所以我想用mode()值填充它.我写了这样的东西: data['Native Country'].fillna(data['Native Country'].mode(), inplace=True) 但是,当我计算缺失值时: for col_name in data.columns:
..
我想使用fillna方法用另一列中的值填充一列中的缺失值. (我读到循环遍历将是非常糟糕的做法,一次完成所有操作会更好,但我找不到使用fillna的方法.) 之前的数据: Day Cat1 Cat2 1 cat mouse 2 dog elephant 3 cat giraf 4 NaN ant 之后的数据: Day Cat
..
这应该很简单,但是我发现最接近的是这篇文章: pandas:填充组中的缺失值,但我仍然可以不能解决我的问题...... 假设我有以下数据框 df = pd.DataFrame({'value': [1, np.nan, np.nan, 2, 3, 1, 3, np.nan, 3], 'name': ['A','A', 'B','B','B','B', 'C','C','C']})
..
需要用该NA的过去三个值来填充NA值 这是我的数据集 RECEIPT_MONTH_YEAR NET_SALES 0 2014-01-01 818817.20 1 2014-02-01 362377.20 2 2014-03-01 374644.60 3 2014-04-01不适用 4 2014-05-01不适用 5 2014-06-01不适用
..