pandas相关内容

将小数设置为列中的百分比格式

假设我有以下 pandas DataFrame: df = pd.DataFrame({'name': ['Johnny', 'Brad'], 'rating': [1.0, 0.9]}) 我希望将rating列从小数转换为字符串百分比(例如1.0到'100%')。以下各项工作正常: def decimal_to_percent_string(row): return '{ ..
发布时间:2022-08-15 18:30:00 Python

pandas 系列中的缺失值检查

我使用Pandas包生成了一个流量序列: data = np.array(data) index = date_range(time_start[0],time_end[0],freq='30S') s = Series(data, index=index) 示例的输出如下所示: 2013-07-02 10:04:30 13242.0 2013-07-02 10:05:00 ..
发布时间:2022-08-15 18:14:49 Python

如何检查 pandas 数据框是否只包含数字列?

我想检查数据帧中的每一列是否只包含数字。我怎样才能找到它。 推荐答案 您可以使用to_numeric和强制错误进行检查: pd.to_numeric(df['column'], errors='coerce').notnull().all() 对于所有列,您可以遍历列或仅使用apply df.apply(lambda s: pd.to_numeric(s, errors ..
发布时间:2022-08-15 18:08:06 Python

窗口函数在pd.read_sql中不起作用;它显示错误

我目前在Google Collab(Jupyter笔记本)中使用欧洲足球SQLite数据库进行数据分析。 分析的目的;对于特定的球队ex:切尔西,获取每场比赛的胜负标签(使用Case语句完成),然后按赛季和胜负结果划分比赛计数。 这一切都是在Google Collab(Jupyter笔记本)中的pd.Read_SQL()语句中完成的。 在引入窗口函数之前,该语句运行得很好。但是查询在S ..
发布时间:2022-08-14 17:17:24 数据库

用零蟒熊填满NaN

这是我的代码: for col in df: if col.startswith('event'): df[col].fillna(0, inplace=True) df[col] = df[col].map(lambda x: re.sub("D","",str(x))) 我有0到10个事件列“Event_0,Event_1,...” 当我用此代 ..
发布时间:2022-08-13 11:57:18 Python

通过三维x,y,z散点图数据拟合直线

我有几个数据点,它们在3D空间中沿着一条线聚集。我在CSV文件中有要导入的x、y、z数据。我想找一个方程来表示这条线,或者垂直于这条线的平面,或者任何数学上正确的东西。这些数据是相互独立的。也许有比我试着做的更好的方法来做这件事,但是... 我试图在这里复制一个旧帖子,它似乎正在做我想要做的事情 Fitting a line in 3D 但似乎过去十年的更新可能导致代码的第二部分无法运行?或许 ..
发布时间:2022-08-12 11:13:04 Python

如何将来自不同EXCEL工作表的数据绘制在同一图表中

我需要在Python上创建一个交互式图表,从Excel文件的不同工作表获取数据。我试图创建一个for循环来自动获取所有工作表中的数据,但我设法只绘制来自文件最后一个工作表的数据。 我还想用数据来源的工作表的名称创建一个图例。这是我的代码,你能帮我改进一下吗? import openpyxl as xl import os, os.path import pandas as pd import ..
发布时间:2022-08-10 22:47:39 Python

pandas --列间插补

我有一个问题,希望你能帮我。假设Pandas Dataframe如下所示: 我想做一个线性插值法来填充缺失的NaN值。当我在搜索时,我只找到了必须对同一列中的值进行内插的示例,没有跨列的。 有没有办法在NaN值的左侧和右侧之间进行内插? 致以亲切的问候 ps:截取的代码: import pandas as pd data = {'A':[2,4,6,8,4], ..
发布时间:2022-08-09 22:12:46 Python

基于值列的下拉式条形图(打印)

有人能帮我在绘图条形图中添加下拉菜单吗? 我在以下链接上找到了一些信息(https://plot.ly/python/v3/dropdowns/),但我正在努力修改代码,因此下拉选项是某一列中的所有(唯一)值) 例如a(我的表格的一部分如下: date Reason name Task 2019-11-17 AI ..
发布时间:2022-08-07 23:02:08 Python

PDF转Pandas数据框

就在我想我终于得到它的时候,这样一个新手。 我正在尝试从PDF表格的列中获取数字列表。 我想要转换为Panda DF的第一步。 pip install tabula-py pip install PyPDF2 import pandas as pd import tabula df = tabula.read_pdf('/content/Manifest.pdf') 但是, ..
发布时间:2022-08-06 20:22:09 Python

类型错误:在 pandas DataFrame上使用Dask时无法设置PICKLE_THREAD._LOCAL对象

我有一个巨大的DataFrame,为了节省时间,我想使用Dask来处理它。问题是,当这个TypeError: can't pickle _thread._local objects错误一开始运行时,我就陷入了这个错误。有人能帮帮我吗? 我已经编写了一个函数,该函数根据df的行来处理存储在df中的数据,并用 out = df_query.progress_apply(lambda row ..
发布时间:2022-08-06 11:57:14 Python

数字对象不可调用-使用Pandas

我正在测试从Amazon RedShift数据库到 我的本地数据库使用的是PostgreSQL。我编写了一个查询来获得一个表 并将其转换为 pandas 数据帧。现在, 每当我想要在DataFrame对象上应用一些函数时,我 出现以下错误。我试过几次修改它,而且 已查找了许多解决方案,但似乎无法解决此问题。 cur.execute("QUERY for PostgreSQL") rows = ..
发布时间:2022-08-04 16:08:53 Python

Python-根据每个项目的位置将文本解析为多个列

巴西证券交易所(Bovespa)提供了一个文件,其中包含一个时间框架内的所有报价。文件太大,每一行都类似于这个真实的示例: 数据-lang=“js”数据-隐藏=“假”数据-控制台=“真”数据-巴贝尔=“假”> 012016010402AAPL34 010APPLE DRN R$ 00000000041500000000004220000000000 ..
发布时间:2022-08-04 14:35:15 Python

Python Seborn Ridge绘图教程不起作用

如果我复制粘贴Seaborn website中给出的示例以生成";Ridge Plot&Quot;,则代码在两个不同的点上失败: import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt sns.set_theme(style="white", rc={"a ..
发布时间:2022-08-03 15:06:21 Python