pandas 第5页 - IT屋-程序员软件开发技术分享社区

大 pandas 因具体情况而产生的日间时差

我有一个数据框，如下所示 Tenancy_ID Unit_ID Unit_Create_Date Tenancy_Start_Date 1 A 2012-09-06 13:34:15 2012-09-08 11:34:14 2 A 2 ..

发布时间：2022-08-03 11:50:14 pandas pandas-groupby Python

使用Pandas Groupby连接多行中的字符串，并从逗号分隔的单元格中删除重复项

我有以下数据并尝试按唯一ID聚合，需要在各自列的一个单元格中获取唯一名称、唯一产品、唯一价格 Unique_id Name Product Price 101 ABC Ltd A 100 102 JKL Ltd B 200 101 ABC Ltd B 200 102 JKL US ..

发布时间：2022-08-03 11:44:20 pandas pandas-groupby Python

正在获取百分比和计数Python

Suppoosedf.bun(df是Pandas DataFrame)是一个多索引(日期和名称)，变量是以字符串形式写入的类别值， date name values 20170331 A122630 stock-a A123320 stock-a A152500 ..

发布时间：2022-08-03 11:39:11 python pandas percentage pandas-groupby Python

Jupyter输入、显示、打印执行顺序混乱

我使用的是Jupyter，我的Python版本是3.5。在我的while循环中，执行顺序不正确；一个迭代的input显示在前一个迭代的最后print之前。这是我的代码。 from IPython.display import display import pandas as pd df = pd.DataFrame({'a':[1,2],'b':[3,4]}) while(True): ..

发布时间：2022-08-02 18:25:57 python pandas output jupyter-notebook Python

列表中各对的乘积之和

这就是我的问题。给出一个列表 xList = [9, 13, 10, 5, 3] 我想计算每个元素乘以后续元素的和 sum([9*13, 9*10, 9*5 , 9*3]) + sum([13*10, 13*5, 13*3]) + sum([10*5, 10*3]) + sum ([5*3]) 在这种情况下，答案是608。有没有办法可以使用itertools或本机 ..

发布时间：2022-07-21 21:14:34 python numpy pandas itertools Python

PANDA和GLOB：将文件夹中的所有xlsx文件转换为CSV类型错误：init()获得意外的关键字参数'；xfid'；

我有一个文件夹，其中包含许多要转换为CSV文件的xlsx文件。在我的研究过程中，我发现了几个关于这个话题的帖子，比如this或that一个。基于此，我使用glob和pandas编写了以下代码： import glob import pandas as pd path = r'/Users/.../xlsx files' excel_files = glob.glob(path + ..

发布时间：2022-07-21 10:17:27 python pandas csv glob converters Python

Pandas NumPy：数学运算时使用序列设置数组元素

我有一个名为df4的df，您可以通过以下代码获得它： df4s = """ contract RB BeginDate ValIssueDate EndDate Valindex0 48 46 47 49 50 2 A00118 46 19850100 19880901 99999999 50 1 2 3 7 7 3 ..

发布时间：2022-07-20 19:59:59 python pandas dataframe numpy numpy-ndarray Python

我想将所有这些行和列转换为像这样的2行

A B C D X 1 2 3 Y 5 6 7 Z 11 12 13 我想像这样转换上面的数据框 XA XB XC XD YA ..... ZD 1 2 3 4 5 14 请帮我推荐答案使用： s = df.stack() new_df = s.to_frame().T.set_axis([f'{x}{y}' for x, y in s.index] ..

发布时间：2022-07-20 19:51:21 python pandas dataframe machine-learning numpy-ndarray AI人工智能

归一化PANDA数据框中的列

我有一个 pandas 数据框，它有语料库的词频，以词为行，以年为列，如下所示： | | term | 2002 | 2003 | 2004 | 2005 | |------:|:--------|-------:|-------:|-------:|-------:| | 3708 | climate | 1 | 10 | 1 ..

发布时间：2022-07-20 15:56:31 python pandas normalization Python

向Pandas.Series添加自定义属性

我正在尝试向pd.DataFrame内的每个pd.Series添加一个自定义属性。具体地说，我得到了一个CSV，其中间歇性地将颜色代码嵌入到列标题中。我希望在绘制图表之前将这些内容预先处理成一个属性，并将默认颜色分配给其他未指定的列。但在其核心部分，我只需要在Series中的某个位置添加一个定制属性，就像您在任何其他Python对象上可能做的那样。简化示例： >>> import pan ..

发布时间：2022-07-19 23:30:00 python python-3.x pandas dataframe series Python

滚动平均两两相关在Python中的应用

我每天从三个市场(GLD、SPY和USO)获得回报。我的目标是在130天的滚动基础上，从相关矩阵计算平均成对相关性。我的起点是： import numpy as np import pandas as pd import os as os import pandas.io.data as web import datetime as datetime from pandas.io.d ..

发布时间：2022-07-18 16:35:13 python pandas average correlation Python

对于不能使用astype强制转换的值，请使用NaN

我有一个非常大的Pandas DataFrame，看起来像这样： >>> d = pd.DataFrame({"a": ["1", "U", "3.4"]}) >>> d a 0 1 1 U 2 3.4 当前该列设置为object： >>> d.dtypes a object dtype: object 我想将此列转换为浮点型，以便我可以使用gro ..

发布时间：2022-07-16 13:01:09 python pandas dataframe nan Python

更新：如何从DaskDataFrame转换/解析字符串日期

更新：我能够执行转换。下一步是将其放回ddf。我按照书中的建议所做的是：日期已分析并存储为单独的变量。使用删除了原始日期列 ddf2=ddf.drop('date',axis=1) 使用Assign追加新的分析日期 ddf3=ddf2.assign(date=parsed_date) 新日期已添加为新列，最后一列。问题1：有没有更有效的方 ..

发布时间：2022-07-16 12:19:58 python pandas datetime dask dask-dataframe Python

将对象转换为浮动会损失太多精度- pandas

我正在尝试使用pandas绘制DataFrame，但它不起作用(有关详细信息，请参阅this类似的线程)。我认为部分问题可能是我的DataFrame似乎由objects组成： >>> df.dtypes Field object Moment object Temperature object 但是，如果将所有值转换为float类型，则会损失很多精 ..

发布时间：2022-07-15 10:43:46 python pandas floating-point-precision Python

使用OpenPYXL获取单个单元格的值

我认为这将是一项非常简单的任务，但事实证明它比我想象的要复杂得多。尝试读取带有值表的简单EXCEL电子表格，然后将对值执行计算并输出新工作表。第一个问题是，人们推荐使用什么库？ pandas ？Openpyxl？目前使用的是Openpyxl，正在努力获得单个细胞的值。以下是一些代码： collectionOrder = np.empty( [numRows,2], dtype=' ..

发布时间：2022-07-12 17:57:29 python excel pandas openpyxl Python

是否为多个EXCEL工作表保留N、N+1行的文本和N+2行的标题？

我有如下所示的数据帧 SHEET SUBJECT Listings for 2010 hi bla bla,,,,,, order_number,,,,,, Date,cust,region,Abr,Number, 12/01/2010,Company_Name,Somecity,Chi,36, 12/02/2010,Company_Name,Someothercity,N ..

发布时间：2022-07-12 17:53:21 python pandas dataframe openpyxl pandas.excelwriter Python

用Python语言写入Excel文件

import pandas as pd import openpyxl filename="Tests.xlsx" def createWorkBook(): wrkbk = openpyxl.Workbook() ws = wrkbk.active Sheets=["Rostered Patient","Non-Rostered Patient","Email","E ..

发布时间：2022-07-12 17:04:27 python excel pandas openpyxl Python

蟒蛇k-均值，质心被放置在集群的外部

我正在尝试使用k-Means算法执行混合数据的聚类：chemical_1，chemical_2-数值，season-分类。已将season列转换为虚拟对象，以便在K-Means算法中使用它。我已使用plt.scatter(centers[:,0], centers[:,1], marker="x", color='r')添加了群集中心，但它将它们放在了错误的位置，位于群集之外。我应该 ..

发布时间：2022-07-01 19:59:17 python pandas cluster-analysis Python

在Python中使用Pandas从每列中获取前4个最大值

我有两个专栏，显示了对积极分数和消极分数的情绪分析。以下是输出： scat=btweet[['sentiment_pos', 'sentiment_negative']] scat sentiment_pos sentiment_negative 0.286 0.000 0.451 0.000 0.143 ..

发布时间：2022-07-01 09:19:32 python pandas numpy subset Python

pandas 版本兼容特定的蟒蛇和NumPy配置吗？

有没有一种编程方法可以找出哪些 pandas 版本与特定的Python和Numpy配置兼容？我的兴趣是让 pandas 在ESRI ArcMAP 10.1中运行，它运行在32位Windows上，构建在Python2.7和NumPy 1.6之上。我尝试通过打开一个32位的Anaconda命令提示符并键入来为与ESRI ArcMap 10.1兼容的Python创建Conda环境 ..

发布时间：2022-06-30 21:20:09 python pandas anaconda conda Python

pandas相关内容