pandas相关内容

如何计算与熊猫的滚动相关性?

我了解如何计算滚动总和,std或平均值.示例: df['MA10'] = df['Asset1'].rolling(10).mean() 但是我不理解用于计算两个数据框列之间滚动相关性的语法:df['Asset1']和df['Asset2'] 文档中没有提供有关关联的任何示例. https://pandas.pydata.org/pandas-docs/stable/gene ..
发布时间:2020-05-24 01:58:18 Python

替换熊猫数据框中的特殊字符

所以,我有一个用iso8859_15编码的巨大DF. 我有几列包含巴西的名称和位置,因此其中一些包含特殊字符,例如“í"或“Ô". 我有密钥将它们替换为字典{'í':'i','á':'a',...} 我尝试了以下几种方法来替换它,但是没有一种起作用. df.replace(dictionary, regex=True, inplace=True) ###BOTH WITH ..
发布时间:2020-05-24 01:58:12 Python

Spark中的分组线性回归

我正在PySpark工作,我想找到一种对数据组执行线性回归的方法.专门针对此数据框 import pandas as pd pdf = pd.DataFrame({'group_id':[1,1,1,2,2,2,3,3,3,3], 'x':[0,1,2,0,1,5,2,3,4,5], 'y':[2,1,0,0,0 ..
发布时间:2020-05-24 01:58:09 Python

AttributeError:模块"pandas"没有属性"read_csv" Python3.5

很长一段时间以来,我一直成功使用pandas.read_csv,但是突然间,当我尝试读取csv文件时,它开始出现错误 df = pd.read_csv('file.csv', encoding='utf-8') 错误是 AttributeError: module 'pandas' has no attribute 'read_csv' 我曾尝试升级熊猫,但不起作用.我尝试搜索 ..
发布时间:2020-05-24 01:58:07 Python

将Pandas数据框转换为时间序列

我有一个Pandas DataFrame: Out[57]: lastrun rate 0 2013-11-04 12:15:02 0 1 2013-11-04 13:14:50 4 2 2013-11-04 14:14:48 10 3 2013-11-04 16:14:59 16 我想将其转换为每小时的时间序列并内插缺失 ..
发布时间:2020-05-24 01:57:51 Python

如何在熊猫中读取大json?

我的代码是:data_review=pd.read_json('review.json') 我的数据review如下: { // string, 22 character unique review id "review_id": "zdSx_SD6obEhz9VrW9uAWA", // string, 22 character unique user id, ma ..
发布时间:2020-05-24 01:57:49 Python

groupby和聚合后的Python Pandas排序

我试图在对数据(熊猫)进行分组和汇总后进行排序,但我陷入了困境.我的数据: data = {'from_year': [2010, 2011, 2012, 2011, 2012, 2010, 2011, 2012], 'name': ['John', 'John1', 'John', 'John', 'John4', 'John', 'John1', 'John6'], 'o ..
发布时间:2020-05-24 01:57:44 Python

有没有办法在熊猫中将dtypes生成为字典?

键入df.dtypes时,我们具有类型列表. 但是,有没有一种简单的方法可以将输出获取为 {'col1': np.float32, ...} 还是我需要自己编写一个函数? 解决方案 df.dtypes的类型返回对象是pandas.Series.它具有to_dict方法: df = pd.DataFrame({'A': [1, 2], ..
发布时间:2020-05-24 01:57:42 Python