pandas 第4页 - IT屋-程序员软件开发技术分享社区

将小数设置为列中的百分比格式

假设我有以下 pandas DataFrame： df = pd.DataFrame({'name': ['Johnny', 'Brad'], 'rating': [1.0, 0.9]}) 我希望将rating列从小数转换为字符串百分比(例如1.0到'100%')。以下各项工作正常： def decimal_to_percent_string(row): return '{ ..

pandas 系列中的缺失值检查

我使用Pandas包生成了一个流量序列： data = np.array(data) index = date_range(time_start[0],time_end[0],freq='30S') s = Series(data, index=index) 示例的输出如下所示： 2013-07-02 10:04:30 13242.0 2013-07-02 10:05:00 ..

发布时间：2022-08-15 18:14:49 python pandas series Python

如何检查 pandas 数据框是否只包含数字列？

我想检查数据帧中的每一列是否只包含数字。我怎样才能找到它。推荐答案您可以使用to_numeric和强制错误进行检查： pd.to_numeric(df['column'], errors='coerce').notnull().all() 对于所有列，您可以遍历列或仅使用apply df.apply(lambda s: pd.to_numeric(s, errors ..

发布时间：2022-08-15 18:08:06 python pandas dataframe series Python

窗口函数在pd.read_sql中不起作用；它显示错误

我目前在Google Collab(Jupyter笔记本)中使用欧洲足球SQLite数据库进行数据分析。分析的目的；对于特定的球队ex：切尔西，获取每场比赛的胜负标签(使用Case语句完成)，然后按赛季和胜负结果划分比赛计数。这一切都是在Google Collab(Jupyter笔记本)中的pd.Read_SQL()语句中完成的。在引入窗口函数之前，该语句运行得很好。但是查询在S ..

发布时间：2022-08-14 17:17:24 python pandas sqlite jupyter-notebook window-functions 数据库

pandas ：如何删除以NaN为列名的多个列？

根据标题，下面是一个可重复使用的示例： raw_data = {'x': ['this', 'that', 'this', 'that', 'this'], np.nan: [np.nan, np.nan, np.nan, np.nan, np.nan], 'y': [np.nan, np.nan, np.nan, np.nan, np.n ..

发布时间：2022-08-13 12:11:19 python pandas dataframe nan Python

根据条件掩码 pandas 数据帧中的值

我需要替换数据帧中低于NAS的特定值的值。例如，假设我需要将所有大于100的值替换为NaN df = pd.DataFrame({'a':[1,250,480], 'b':[60,51,101], 'c':[15,689,1]}) 将变为： ({'a':[1,NaN,NaN], 'b':[60,51,NaN], ..

发布时间：2022-08-13 12:03:30 python pandas dataframe nan Python

用零蟒熊填满NaN

这是我的代码： for col in df: if col.startswith('event'): df[col].fillna(0, inplace=True) df[col] = df[col].map(lambda x: re.sub("D","",str(x))) 我有0到10个事件列“Event_0，Event_1，...” 当我用此代 ..

发布时间：2022-08-13 11:57:18 python pandas nan series imputation Python

我有几个数据点，它们在3D空间中沿着一条线聚集。我在CSV文件中有要导入的x、y、z数据。我想找一个方程来表示这条线，或者垂直于这条线的平面，或者任何数学上正确的东西。这些数据是相互独立的。也许有比我试着做的更好的方法来做这件事，但是... 我试图在这里复制一个旧帖子，它似乎正在做我想要做的事情 Fitting a line in 3D 但似乎过去十年的更新可能导致代码的第二部分无法运行？或许 ..

发布时间：2022-08-12 11:13:04 python pandas numpy matplotlib linear-algebra Python

如何将来自不同EXCEL工作表的数据绘制在同一图表中

我需要在Python上创建一个交互式图表，从Excel文件的不同工作表获取数据。我试图创建一个for循环来自动获取所有工作表中的数据，但我设法只绘制来自文件最后一个工作表的数据。我还想用数据来源的工作表的名称创建一个图例。这是我的代码，你能帮我改进一下吗？ import openpyxl as xl import os, os.path import pandas as pd import ..

发布时间：2022-08-10 22:47:39 python excel pandas plotly openpyxl Python

pandas --列间插补

我有一个问题，希望你能帮我。假设Pandas Dataframe如下所示：我想做一个线性插值法来填充缺失的NaN值。当我在搜索时，我只找到了必须对同一列中的值进行内插的示例，没有跨列的。有没有办法在NaN值的左侧和右侧之间进行内插？致以亲切的问候 ps：截取的代码： import pandas as pd data = {'A':[2,4,6,8,4], ..

发布时间：2022-08-09 22:12:46 python pandas interpolation Python

在 pandas 数据框中高效地对多列应用多个条件

我有一个包含数十列的DataFrame。 Therapy area Procedures1 Procedures2 Procedures3 Oncology 450 450 2345 Oncology 367 367 415 Oncology 152 152 ..

发布时间：2022-08-08 17:02:04 python pandas dataframe apply Python

基于值列的下拉式条形图(打印)

有人能帮我在绘图条形图中添加下拉菜单吗？我在以下链接上找到了一些信息(https://plot.ly/python/v3/dropdowns/)，但我正在努力修改代码，因此下拉选项是某一列中的所有(唯一)值) 例如a(我的表格的一部分如下： date Reason name Task 2019-11-17 AI ..

发布时间：2022-08-07 23:02:08 python pandas plotly dropdown visualization Python

GeoPandas中的过度功能不起作用

我只想使用geopandas获得两个多边形区域的并集和交集。我定义： import geopandas as gpd from shapely.geometry import Polygon polys1 = gpd.GeoSeries([Polygon([(0,0), (2,0), (2,2), (0,2)]), Poly ..

发布时间：2022-08-07 15:22:23 python pandas gis geopandas Python

PDF转Pandas数据框

就在我想我终于得到它的时候，这样一个新手。我正在尝试从PDF表格的列中获取数字列表。我想要转换为Panda DF的第一步。 pip install tabula-py pip install PyPDF2 import pandas as pd import tabula df = tabula.read_pdf('/content/Manifest.pdf') 但是， ..

发布时间：2022-08-06 20:22:09 python pandas google-colaboratory Python

我收到TypeError：/：'；str'；和'；str'；不支持的操作数类型

ratings = pd.read_csv(path/'u.data', delimiter=' ', header=None, names=[user,item,'rating','timestamp']) ratings.head() 每当我运行此代码时，都会收到此错误 TypeError：/：‘str’和‘str’不支持的操作数类型推荐答案检查您的文件路径。它应该 ..

发布时间：2022-08-06 12:00:48 pandas typeerror unsupportedoperation Python

类型错误：在 pandas DataFrame上使用Dask时无法设置PICKLE_THREAD._LOCAL对象

我有一个巨大的DataFrame，为了节省时间，我想使用Dask来处理它。问题是，当这个TypeError: can't pickle _thread._local objects错误一开始运行时，我就陷入了这个错误。有人能帮帮我吗？我已经编写了一个函数，该函数根据df的行来处理存储在df中的数据，并用 out = df_query.progress_apply(lambda row ..

发布时间：2022-08-06 11:57:14 python pandas typeerror dask Python

使用PYTHON的透视表

我有包含列的数据集 Country 2001 2002 2003 ... import python as pd df=pd.DataFrame({"country":['India','UK','France','US','Nepal'],'2001':[1,2,3,4,5], '2002':[1,2,3,4,5],'2003':[1 ..

发布时间：2022-08-04 23:14:50 python pandas dataframe pivot-table Python

数字对象不可调用-使用Pandas

我正在测试从Amazon RedShift数据库到我的本地数据库使用的是PostgreSQL。我编写了一个查询来获得一个表并将其转换为 pandas 数据帧。现在, 每当我想要在DataFrame对象上应用一些函数时，我出现以下错误。我试过几次修改它，而且已查找了许多解决方案，但似乎无法解决此问题。 cur.execute("QUERY for PostgreSQL") rows = ..

发布时间：2022-08-04 16:08:53 python postgresql pandas numpy amazon-redshift Python

Python-根据每个项目的位置将文本解析为多个列

巴西证券交易所(Bovespa)提供了一个文件，其中包含一个时间框架内的所有报价。文件太大，每一行都类似于这个真实的示例：数据-lang=“js”数据-隐藏=“假”数据-控制台=“真”数据-巴贝尔=“假”> 012016010402AAPL34 010APPLE DRN R$ 00000000041500000000004220000000000 ..

发布时间：2022-08-04 14:35:15 python pandas jupyter bigdata Python

Python Seborn Ridge绘图教程不起作用

如果我复制粘贴Seaborn website中给出的示例以生成"；Ridge Plot&Quot；，则代码在两个不同的点上失败： import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt sns.set_theme(style="white", rc={"a ..

发布时间：2022-08-03 15:06:21 pandas matplotlib seaborn Python

pandas相关内容