pandas相关内容

蟒蛇k-均值,质心被放置在集群的外部

我正在尝试使用k-Means算法执行混合数据的聚类:chemical_1,chemical_2-数值,season-分类。 已将season列转换为虚拟对象,以便在K-Means算法中使用它。 我已使用plt.scatter(centers[:,0], centers[:,1], marker="x", color='r')添加了群集中心,但它将它们放在了错误的位置,位于群集之外。 我应该 ..
发布时间:2022-07-01 19:59:17 Python

pandas 版本兼容特定的蟒蛇和NumPy配置吗?

有没有一种编程方法可以找出哪些 pandas 版本与特定的Python和Numpy配置兼容? 我的兴趣是让 pandas 在ESRI ArcMAP 10.1中运行,它运行在32位Windows上,构建在Python2.7和NumPy 1.6之上。 我尝试通过打开一个32位的Anaconda命令提示符并键入 来为与ESRI ArcMap 10.1兼容的Python创建Conda环境 ..
发布时间:2022-06-30 21:20:09 Python

在Python pandas 中有没有SQL GROUP BY ROLLUP的等价物?

Here是它在Oracle中的工作方式。我在Pandas中寻找一个简洁的等价物,最好是与DataFrame to Python笔记本的呈现集成在一起。GROUP BY ROLLUP的要点是,如果您按多个列分组,您还将看到聚合,就好像是按这些列的子集分组一样。 推荐答案 参考此答案Pandas Pivot tables row subtotals 它使用SPIVOT_TABLE() ..
发布时间:2022-06-29 19:25:11 Python

堆叠条形图按包含字符串值的特定列进行计数

我使用Seborn获取了一个条形图,其中我的数据按列MONTH计算。 sns.catplot(x = 'MONTH',kind="count",data=df) 我现在想得到的是堆叠的条形图,其中数据按另一列计数TASKTYPE。此列中的条目为字符串。 我的数据帧如下所示: MONTH TASKTYPE 09/19 A 09/19 B 10/19 B 10/19 B 01/2 ..
发布时间:2022-06-27 17:53:26 Python

pandas 丢弃了副本,并用副本的纳米平均值替换了值

我有一个通过追加4个数据帧创建的数据帧(index=date)。正因为如此,我的索引中有重复项,通常同一天有3个nans和1个值。 我的目标是将此数据帧上采样到每天的频率(df = df.resample('1D)),但在此之前,我必须删除重复项。 我想删除重复的时间,但根据两个条件: 对于同一天,如果我们至少有1个值,则计算这些值的纳平均值,然后丢弃其余的。 同一天,如果我们只有N ..
发布时间:2022-06-27 13:31:06 Python

多索引 pandas 数据帧上的Cumsum()

我有一个多索引数据帧,它显示每月交易的总频率。 我正在尝试每年获得一个尊重我的‘mapid’和‘service’多索引的Cumsum()。然而,我不知道如何得出这些数据 combined_df = combined_df.groupby([pd.Grouper(freq='M'), 'provider', 'mapid', 'service']).sum() ..
发布时间:2022-06-27 13:21:25 Python

在 pandas 数据帧上使用isull()和groupby()

假设我有一个包含列‘A’、‘B’、‘C’的DataFrame DF。 我想计算‘B’列中按‘A’分组的NULL值的数量,并根据它创建一个词典: 尝试以下操作失败: df.groupby('A')['B'].isnull().sum().to_dict() 如有任何帮助,将不胜感激。 推荐答案 安装 df = pd.DataFrame(dict(A=[1, 2] * 3 ..
发布时间:2022-06-27 13:14:57 Python

在Pandas中计算滚动回归并存储斜率

我有一些时间序列数据,我想计算Pandas过去n天的GroupWise滚动回归,并将该回归的斜率存储在新列中。 我搜索了较旧的问题,它们要么没有得到回答,要么使用了Pandas OLS,我听说Pandas OLS已被弃用。 我想我可能可以将df.rolling.apply()与scipy.stats.linregress函数结合使用,但我找不出一个lambda函数来做我想做的事情。 ..
发布时间:2022-06-27 12:44:29 Python

《朱庇特笔记本》中正在消失的普洛特利情节?

我在Jupyter Notebook中使用Ploly在Python中创建了一些曲线图,不幸的是,每次我打开Jupyter Notebook时都必须重新加载数据才能在Ploly中看到这些曲线图,为什么会发生这种情况,如果我可以在每次运行Jupyter Notebook时以某种方式使曲线图自动生成? 请给我一些建议,这对我来说真的是个大问题。 例如,当我打开Jupyter Notebook时,我 ..
发布时间:2022-06-25 20:55:40 Python

使用ID和ASOF合并两个数据帧

我有两个数据框要拼接在一起,左边的数据框有信息索引by(日期,ID),右边的数据框有信息索引by(Period,ID),周期是年-月。 结束时,我对左侧帧执行了GROUP BY ID,遍历各个组,在右侧帧上选择相同的组,然后对左侧数据框中组的索引执行AND ASF操作,如下所示: def merge_func(base_df, si_df): df_list = list( ..
发布时间:2022-06-24 15:25:27 Python