pandas 第500页 - IT屋-程序员软件开发技术分享社区

如何计算与熊猫的滚动相关性?

我了解如何计算滚动总和，std或平均值.示例: df['MA10'] = df['Asset1'].rolling(10).mean() 但是我不理解用于计算两个数据框列之间滚动相关性的语法:df['Asset1']和df['Asset2'] 文档中没有提供有关关联的任何示例. https://pandas.pydata.org/pandas-docs/stable/gene ..

用熊猫替换字符串中字符的所有但最后一次出现的字符

使用Pandas删除字符串中除最后一个期间外的所有内容，如下所示: s = pd.Series(['1.234.5','123.5','2.345.6','678.9']) counts = s.str.count('\.') target = counts==2 target 0 True 1 False 2 True 3 False dtype: bool ..

发布时间：2020-05-24 01:58:16 python regex string pandas Python

在同一图上的Python并排箱图

我试图在Python 2.7中为下面的Pandas数据框中的E列中的每个分类值生成一个箱形图 A B C D E 0 0.647366 0.317832 0.875353 0.993592 1 1 0.504790 0.041806 0.113889 0.445370 2 2 0.769335 0. ..

发布时间：2020-05-24 01:58:14 python-2.7 pandas matplotlib Python

替换熊猫数据框中的特殊字符

所以，我有一个用iso8859_15编码的巨大DF. 我有几列包含巴西的名称和位置，因此其中一些包含特殊字符，例如“í"或“Ô". 我有密钥将它们替换为字典{'í':'i'，'á':'a'，...} 我尝试了以下几种方法来替换它，但是没有一种起作用. df.replace(dictionary, regex=True, inplace=True) ###BOTH WITH ..

发布时间：2020-05-24 01:58:12 python pandas Python

Spark中的分组线性回归

我正在PySpark工作，我想找到一种对数据组执行线性回归的方法.专门针对此数据框 import pandas as pd pdf = pd.DataFrame({'group_id':[1,1,1,2,2,2,3,3,3,3], 'x':[0,1,2,0,1,5,2,3,4,5], 'y':[2,1,0,0,0 ..

发布时间：2020-05-24 01:58:09 python pandas apache-spark pyspark Python

AttributeError:模块"pandas"没有属性"read_csv" Python3.5

很长一段时间以来，我一直成功使用pandas.read_csv，但是突然间，当我尝试读取csv文件时，它开始出现错误 df = pd.read_csv('file.csv', encoding='utf-8') 错误是 AttributeError: module 'pandas' has no attribute 'read_csv' 我曾尝试升级熊猫，但不起作用.我尝试搜索 ..

发布时间：2020-05-24 01:58:07 python python-3.x pandas Python

使用管道表达熊猫子集

我有一个像这样子集的数据框: a b x y 0 1 2 3 -1 1 2 4 6 -2 2 3 6 6 -3 3 4 8 3 -4 df = df[(df.a >= 2) & (df.b ..

发布时间：2020-05-24 01:58:05 python pandas pipe Python

熊猫和scikit-learn:KeyError:[....]不在索引中

我不明白为什么在运行此代码时出现错误KeyError: '[ 1351 1352 1353 ... 13500 13501 13502] not in index': cv = KFold(n_splits=10) for train_index, test_index in cv.split(X): f_train_X, f_valid_X = X[train_index], X ..

发布时间：2020-05-24 01:58:03 python pandas scikit-learn Python

如何使用Python下载股价数据?

我已经安装了pandas-datareader，但是我想知道是否还有其他选择. 到目前为止，我正在使用它: import pandas_datareader.data as web start_date = '2018-01-01' end_date = '2018-06-08' panel_data = web.DataReader('SPY', 'yahoo', start_dat ..

发布时间：2020-05-24 01:57:59 python pandas stock pandas-datareader Python

如何计算熊猫中最长的不间断序列

比方说我有pd.Series如下 s = pd.Series([False, True, False,True,True,True,False, False]) 0 False 1 True 2 False 3 True 4 True 5 True 6 False 7 False dtype: bool 我想知道最长的Tr ..

发布时间：2020-05-24 01:57:57 python pandas Python

如何在熊猫中向数据框追加新行?

这是我使用的代码 iname = "name1" ipassword = "password1" iemail = "email@domain.com" res1 = [] df = pd.read_csv("login.csv", sep=',', encoding="utf-8") res1.append(iname,ipasswo ..

发布时间：2020-05-24 01:57:55 python pandas csv dataframe Python

将Pandas数据框转换为时间序列

我有一个Pandas DataFrame: Out[57]: lastrun rate 0 2013-11-04 12:15:02 0 1 2013-11-04 13:14:50 4 2 2013-11-04 14:14:48 10 3 2013-11-04 16:14:59 16 我想将其转换为每小时的时间序列并内插缺失 ..

发布时间：2020-05-24 01:57:51 pandas Python

如何在熊猫中读取大json?

我的代码是:data_review=pd.read_json('review.json') 我的数据review如下: { // string, 22 character unique review id "review_id": "zdSx_SD6obEhz9VrW9uAWA", // string, 22 character unique user id, ma ..

发布时间：2020-05-24 01:57:49 python json pandas Python

Python/R:当不是所有节点都包含所有变量时，从XML生成数据帧吗?

请考虑以下XML示例 library(xml2) myxml John tennis golf python ..

发布时间：2020-05-24 01:57:47 python r xml pandas xml2 Python

groupby和聚合后的Python Pandas排序

我试图在对数据(熊猫)进行分组和汇总后进行排序，但我陷入了困境.我的数据: data = {'from_year': [2010, 2011, 2012, 2011, 2012, 2010, 2011, 2012], 'name': ['John', 'John1', 'John', 'John', 'John4', 'John', 'John1', 'John6'], 'o ..

发布时间：2020-05-24 01:57:44 python sorting pandas grouping Python

有没有办法在熊猫中将dtypes生成为字典?

键入df.dtypes时，我们具有类型列表. 但是，有没有一种简单的方法可以将输出获取为 {'col1': np.float32, ...} 还是我需要自己编写一个函数? 解决方案 df.dtypes的类型返回对象是pandas.Series.它具有to_dict方法: df = pd.DataFrame({'A': [1, 2], ..

发布时间：2020-05-24 01:57:42 python pandas Python

如何在ASCII文件中写入/读取具有MultiIndex的Pandas DataFrame?

我希望能够为行和列索引创建一个具有MultiIndexes的Pandas DataFrame，并从ASCII文本文件中读取它.我的数据如下: col_indx = MultiIndex.from_tuples([('A', 'B', 'C'), ('A', 'B', 'C2'), ('A', 'B', 'C3'), ..

发布时间：2020-05-24 01:57:39 python pandas Python

为什么需要将地图类型转换为列表以将其分配给熊猫系列?

我刚刚开始学习熊猫的基础知识，有一件事让我思考. import pandas as pd data = pd.DataFrame({'Column1': ['A', 'B', 'C']}) data['Column2'] = map(str.lower, data['Column1']) print(data) 该程序的输出为: Column1 ..

发布时间：2020-05-24 01:57:37 python python-3.x pandas Python

如何在网页上制作进度栏以进行熊猫操作

我已经搜索了一段时间，无法找到一种方法来做到这一点.我有一个简单的Flask应用程序，它将一个CSV文件，将其读入Pandas数据框，将其转换并输出为新的CSV文件.我已成功上传并成功使用HTML进行了转换 ..

发布时间：2020-05-24 01:57:35 python ajax pandas flask tqdm 前端开发

使用map_partitions和pd.df.to_sql从dask数据框创建sql表

Dask没有像pandas这样的df.to_sql()，因此我正尝试复制功能并使用map_partitions方法创建sql表.这是我的代码: import dask.dataframe as dd import pandas as pd import sqlalchemy_utils as sqla_utils db_url = 'my_db_url_connection' conn = ..

发布时间：2020-05-24 01:57:30 python postgresql pandas dask pandas-to-sql Python

pandas相关内容