pandas 第3页 - IT屋-程序员软件开发技术分享社区

计算每个点具有时间序列的点之间的相关性

我需要一些建议，如何更快地编写代码来解决我的问题。我正在研究如何计算空间(X，Y，Z)中的点之间的相关性，其中对于每个点，我有随时间变化的速度数据，理想情况下，我希望每个点P1计算与所有其他点的速度相关性。最后，我希望有一个矩阵，对于每一对坐标(X1，Y1，Z1)，(X2，Y2，Z2)，我得到皮尔逊相关系数。我不完全确定如何用Python语言最好地组织这项工作。到目前为止，我所做的是定义了不同 ..

时间序列蟒蛇(麻木或 pandas )的线性回归

我对Python和编程一般都是新手，所以请原谅任何简单的错误/应该很明显的事情。我想要做的很简单，我只想将一种线性趋势(一维多项式)与一系列时间序列进行拟合，看看斜率是正还是负。现在，我只是想让它在一个时间序列中发挥作用。问题： pandas 和麻木似乎都不能回归约会时间。我的约会时间不固定(通常为每月1天，但不是同一天)，因此无法使用Linear Regression from Ti ..

发布时间：2022-08-31 11:40:13 python numpy pandas statsmodels Python

仅当值存在时，才将列中的值替换为VLOOKUP另一个数据帧

我想根据(df2.Name1, df2.Name2)中的映射表覆盖我的df1.Name值。但是，并非df1.Name中的所有值都存在于df2.Name1 中 df1： Name Alex Maria Marias Pandas Coala df2： Name1 Name2 Alex Alexs Marias Maria Coala Coalas 预期结果： ..

发布时间：2022-08-29 09:44:47 python pandas dictionary dataframe matching Python

找出在PCA之后我的组件中有哪些功能

我对我的数据执行了主成分分析。数据如下所示： df Out[60]: Drd1_exp1 Drd1_exp2 Drd1_exp3 ... M7_pppp M7_puuu Brain_Region 0 -1.0 -1.0 -1.0 ... 0.0 0.0 BaGr 3 ..

发布时间：2022-08-28 21:58:16 python pandas scikit-learn statistics pca Python

SkLearning PCA：正确的PC维度

我有一个数据帧df，它包含一个名为‘Event’的列，其中有一个24x24x40数值数组。我想：提取此数字数组；将其展平为1x23040向量；将此条目作为列添加到新的Numpy数组或数据帧中；对结果矩阵执行PCA。但是，PCA生成的特征向量的维度为“条目数”，而不是“数据中的维度数”。为了说明我的问题，我演示了一个运行良好的最小示例：示例1 fro ..

发布时间：2022-08-28 21:51:16 pandas dataframe scikit-learn pca Python

如何在有基本事实的情况下，仅为数据帧找到正确的正值？

首先，对于冗长的描述，我深表歉意，但我希望每个人都能理解我所做的事情。我正在研究一个检测模型，它可以预测14种不同的病理，并且我已经制作了一个对任何新的测试图像进行预测的推理文件。我和具有25k以上测试图像的数据集已经找到了他们的预测，并制作了一个这样的文件Dataframe。在此数据框中，我有(了解我的情况的信息很少)： image_name______00000003_ ..

发布时间：2022-08-27 19:51:49 python pandas dataframe model prediction Python

如何从压缩为tar.gz的CSV创建 pandas 数据帧？

如何从压缩为tar.gz的CSV文件创建 pandas DataFrame？我找到了这个代码，它可以做到这一点，但压缩文件。我应该对以下代码进行哪些更改才能使其在不下载tar.gz和CSV文件的情况下与tar.gz一起工作。 import pandas, requests, zipfile, StringIO r =requests.get('http://data.octo.dc.gov/ ..

发布时间：2022-08-27 09:33:49 python csv pandas gzip tar Python

pandas ：检测一个DF和另一个DF之间缺失的列

我有以下代码 import pandas as pd expected_df = pd.DataFrame({'One': [20], 'Two': [30], 'Three': [90]}) df = pd.DataFrame({'One': [20], 'Two': [30]}) assert expected_df.equals(df), 'Test Failed: df is ..

发布时间：2022-08-26 12:09:15 python pandas dataframe assert Python

从df变量中提取HTML信息

亲爱的堆栈溢出社区这是我第一次在这里提问。希望你能放我一马。以下是对问题的描述：我使用ogr2org将KML文件转换为CSV ogr2ogr -f CSV output.csv 'some KML file'.kml 然后我读入了 pandas 的CSV文件 data = pd.read_csv('output.csv') 删除一些奇怪的专栏后，我的结果如下： ..

发布时间：2022-08-23 17:44:01 html pandas kml 前端开发

带滚动面具的 pandas 滚动平均值/不包括参赛项目

我有一个 pandas 数据帧，时间索引如下 import pandas as pd import numpy as np idx = pd.date_range(start='2000',end='2001') df = pd.DataFrame(np.random.normal(size=(len(idx),2)),index=idx) 如下所示： ..

发布时间：2022-08-20 23:48:23 python pandas mask rolling-average Python

查找在五秒间隔内按时间顺序取消餐厅订单的频率

我的数据集如下所示： Order_id 已取消时间 Accept_at 增量 1 2021-07-02 23：30：26 2021-07-02 23：29：21 0天00：01：05 2 2021-09-17 20：35：44 2021-09-17 20：35：33 0天00：00：11 3 2021-05-21 11：47：28 2021-05-21 11：37：19 0天00：10 ..

发布时间：2022-08-19 20:08:22 python pandas time frequency Python

合并名称相似的CSV

摘要给定一个包含以模式Prefix-Year.csv命名的CSV文件的目录，创建一组新的名为Prefix-Aggregate.csv的CSV文件，其中每个聚合文件是具有相同前缀的所有CSV文件的组合。说明我有一个包含5,500个CSV文件的目录，命名方式如下：Prefix-Year.csv。示例： 18394-1999.csv . . . //con ..

发布时间：2022-08-18 16:17:06 python regex csv pandas data-cleaning Python

相似性分数用于过滤 pandas 中的数据帧列

我有一个 pandas 数据帧df，其列名如下 columns = ['Baillie Gifford Positive Change Fund B Accumulation', 'Stewart Investors Worldwide Select Fund Class B (accumulation) Gbp', 'Stewart Investors Worldwide Select ..

发布时间：2022-08-18 16:05:31 pandas dataframe nlp data-cleaning rex Python

颜色必须是aRGB十六进制值？

所以我之前为污染数据集运行了一些代码，代码运行得很好。现在，我得到了这个错误：颜色必须为aRGB十六进制值我仅有的一行代码如下： pollution_jawn = pd.read_excel('ObservationData_irkfioc copy.xlsx') 我不知道问题出在哪里，我甚至尝试从我的jupyterHub目录中删除此文件并上载，但即使这样也不起作用。推 ..

发布时间：2022-08-18 15:24:26 python pandas data-cleaning argb Python

从数据帧中删除特殊字符和字母数字的简单方法

我有一个包含x行和y列数的大型数据集。其中一列为单词和一些不需要的数据。不需要的数据没有特定的模式，因此我发现很难从数据帧中删除它。 nonhashtag ['want', 'better', 'than', 'Dhabi,', 'United', 'Arab', 'Emirates'] ['Just', 'posted', 'photo', 'Rasim', 'Villa'] ['Dhab ..

发布时间：2022-08-18 14:58:30 python regex pandas dataframe data-cleaning Python

Django模板中的循环 pandas 表

我的视图中有一个填充了值的Pandas表。此视图将此数据发送到我的模板。不幸的是，我不能循环这些值，尽管我可以在python外壳中进行循环。我附上我的桌子和我的尝试：我的表(MyTable)： ID day data _|___________|_____ 0| 2017-01-01|100.0| 1| 2017-01-02|99.8 | 2| 2017-01-03| ..

发布时间：2022-08-17 20:09:58 python django pandas itertools Python

在'；Date&39；和'；str'；的实例之间不支持类型错误：'；>；='；

我的 pandas df3看起来像这样： df3 = pd.DataFrame([['23.02.2012', '23.02.2012', 'aaa'], ['27.02.2014', '27.02.2014', 'bbb'], ['17.08.2018', '17.08.2018', 'ccc'], ['22.07.2019', '22.07.2019', 'ddd']], columns ..

发布时间：2022-08-17 18:43:42 python pandas datetime datetime-format python-datetime Python

将图像批注添加到方框图

我想将图像注释添加到盒子图中，类似于他们在本文中对条形图所做的操作： How can I add images to bars in axes (matplotlib) 我的数据帧如下所示： import pandas as pd import numpy as np names = ['PersonA', 'PersonB', 'PersonC', 'PersonD','Perso ..

发布时间：2022-08-16 22:46:07 python pandas matplotlib annotations boxplot Python

使用Matplotlib创建箱形图

我使用的是python3和jupyter笔记本电脑。我有一个 pandas 数据帧，它的结构如下： location price Apr 25 ASHEVILLE 15.0 Apr 25 ASHEVILLE 45.0 Apr 25 ASHEVILLE 50.0 Apr 25 ASHEVILLE 120.0 Apr 25 ASHEVILL ..

发布时间：2022-08-16 22:41:46 python pandas matplotlib boxplot Python

如何使用不同的数据帧设置轴向散布参数来获得散布3D-Plot？

最近，我很难使用两个不同的数据帧来演示3D散点图。我们的想法是提供一个3D散点图，包括两个图例，用于报告集群算法的结果。假设我们有主数据帧df1包含以下3个功能： +-----+------------+----------+----------+ | id| x| y| z| +-----+------------+--------- ..

发布时间：2022-08-16 17:06:06 python pandas matplotlib scatter-plot scatter3d Python

pandas相关内容