dataframe - IT屋-程序员软件开发技术分享社区

将2个数据帧的不同大小的列相乘

我在R中有两个不同的数据框。第一个df1包含许多城市的数据，每个城市都与其对应的州相关联。第二个包含按州聚合的数据，但将这些数据分成多个类。如下所示： states1 ..

发布时间：2022-09-23 10:35:56 r dataframe multiplication 其他开发

有没有办法从 pandas Read_CSV中提取数据类型转换功能？

我有以下数据帧，其中所有列都是对象类型。我的目标是推断出每一列的真实类型并进行转换。我已找到解决办法并将其另存为CSV，然后再次加载。有什么方法可以使用Pandas Read_CSV类型转换功能而无需保存和加载文件？ {'A': {0: nan, 1: nan, 2: nan, 3: nan, 4: nan, 5: ..

发布时间：2022-09-22 19:49:19 python-3.x pandas dataframe type-inference Python

将数据框列转换为存储在列表中的矢量

我的数据由许多列/变量和三行组成。每个变量都是一个整数，各行和各列的值各不相同。以下是我的数据的最小示例： # Minimal example of data frame I have df ..

发布时间：2022-09-22 14:32:20 r list dataframe numeric 其他开发

如何在 pandas 中向下转换数字列？

如何优化数据帧内存占用并为数值列找到最优(最小)数据类型dtypes。例如： A B C D 0 1 1000000 1.1 1.111111 1 2 -1000000 2.1 2.111111 >>> df.dtypes A int64 B int64 C float64 D float64 预期 ..

发布时间：2022-09-22 14:11:35 python pandas dataframe numeric dtype Python

如何从文本中提取表情符号，然后将其添加到新的专栏中？

我想知道如何从文本中提取所有表情符号，然后将它们添加到新的栏中，同时从原始文本中删除它们--如果这有意义的话。例如，考虑以下数据： ID 文本 1 这是很好的💯 2 太爱你了😍❤️ 3 你让我难过！😥 这是我的预期输出： ID 文本表情符号 1 这很好 💯 2 太爱你了 😍❤️ 3 你让我难过！ 😥 到目前为止，我已经尝试了this解决方案 ..

发布时间：2022-09-22 12:57:22 python pandas dataframe emoji Python

函数在多索引 pandas 数据帧中的应用

这是我正在处理的DataFrame的示例： import pandas as pd import numpy as np from scipy.stats import zscore df = pd.DataFrame( index=pd.MultiIndex.from_tuples( [('Monday', '2019-11-04'),('Monday', '2019- ..

发布时间：2022-09-20 23:19:51 python pandas dataframe scipy multi-index Python

选择数据帧

我的数据帧如下： Tahun Jan Feb Mar Apr Mei Jun Jul Ags Sep Okt Nov Des 0 2020 0.39 0.28 0.10 0.08 0.07 0.18 -0.10 -0.05 -0.05 0.07 ..

发布时间：2022-09-20 22:59:14 python pandas dataframe join multi-index Python

将多索引DF的行转置为列

我有一个如下所示的df： pid time id vid id1 vis_id1 pid1 t_0 vis_id1 pid2 t_1 id2 vis_id2 pid1 t_3 ..

发布时间：2022-09-20 22:49:09 python pandas dataframe pivot multi-index Python

Python-Pandas-将特定函数应用于给定级别-多索引数据框架

我有一个多索引DataFrame，并且我希望仅对分配给我的一个级别的向量应用一些计算。使用以下代码： import pandas as pd import datetime ticker_date = [('US',datetime.date.today()-datetime.timedelta(3)), ('US',datetime.date.today()-datetime.ti ..

发布时间：2022-09-20 22:30:10 python pandas dataframe multi-index Python

多索引数据帧删除每个组具有最大值的行

我有一个多索引数据帧，如下所示： PID Fid x y A 1 2 3 2 6 1 3 4 6 B 1 3 5 2 2 4 3 5 7 我想删除每个患者具有最高x值(P ..

发布时间：2022-09-20 22:22:26 python pandas dataframe multi-index Python

获取多索引中某个级别的最后一个元素

我有一个以下格式的数据帧： a b x 1 1 31 1 2 1 1 3 42 1 4 423 1 5 42 1 6 3 1 7 44 1 8 65437 1 9 73 2 1 5656 2 2 7 2 3 5 2 4 5 2 5 34 a和b是索引，x是值。我 ..

发布时间：2022-09-20 21:54:05 python numpy pandas dataframe multi-index Python

pandas 更新多索引数据帧中的值

如何编辑多索引数据框的值？如果它是非多索引数据帧，我知道我可以这样做：df.at[0,'foo'] = 12.3。此外，这也不起作用：df.loc[0]['foo']['a'] = 12.3。考虑多索引列数据帧。 colnames = [ ['foo', 'foo', 'foo', 'po', 'po', 'po', 'di', 'di', 'di'], ['a', ..

发布时间：2022-09-20 21:50:33 python pandas dataframe multi-index Python

基于多个一级列的子集多索引DataFrame

我有一个多=索引的DataFrame，但我希望每个级别1只保留两列，用于每个级别0变量(即列‘1’和‘2’)。我可以单独设置它们的子集，但我想一起设置子集，这样我就可以并排保留这些值这是DataFrame index = pd.MultiIndex.from_tuples(list(zip(*[['bar1', 'foo1', 'bar1', 'foo2','bar3','foo3' ..

发布时间：2022-09-20 21:16:11 python pandas dataframe multi-index Python

在 pandas 中使用带有多重索引的.loc

有没有人知道是否可以使用DataFrame.loc方法从MultiIndex中进行选择？我有以下DataFrame，并且希望能够访问位于('at', 1)、('at', 3)、('at', 5)等索引(非顺序)的Dwell列中的值。我希望能够执行类似data.loc[['at',[1,3,5]], 'Dwell']的操作，类似于常规索引的data.loc[[1,3,5], 'Dwell'] ..

发布时间：2022-09-20 21:06:27 python pandas dataframe multi-index Python

如何对多索引数据帧进行重新索引

是否有办法对(不同级别的)两个数据帧重新编制索引，以便它们在所有级别上共享一个公共索引？演示：创建名为‘A’的基本数据帧： index = np.array(['AUD','BRL','CAD','EUR','INR']) data = np.random.randint(1, 20, (5,5)) A = pd.DataFrame(data=data, index=inde ..

发布时间：2022-09-20 20:54:33 pandas dataframe multi-index Python

我应该如何在Stack Overflow POST中发布来自Juptyer笔记本的DataFrame输出？

我尝试从问题中的jupyter笔记本复制粘贴数据帧的输出，然后是Ctrl+K命令，但是发生了这种情况， SUMLEV REGION COUNTY STNAME CTYNAME CENSUS2010POP ESTIMATESBASE2010 0 50 3 1 Alabama Autauga County 54571 54571 1 50 3 3 ..

发布时间：2022-09-06 20:28:37 python dataframe copy paste Python

粘贴数据帧的列，然后查看它们(&Q)

我尝试粘贴两列数据帧，然后使用“View”函数查看结果字符向量，但收到以下错误： “视图中的错误：‘NAMES’属性[2]的长度必须与向量[1]相同” 以下是我的可重复使用的示例： name1 ..

发布时间：2022-09-06 20:10:04 r dataframe paste 其他开发

如何在h5文件中分层写入大的多个数组？

假设我有10000个系统。对于每个系统，我都有两个数据集：对于每个数据集，我都有x、y和y_err数组。如何使用h5py或pandas将所有系统的数据放到一个h5文件中？下面给出了详细说明。 Systems=np.arange(10000) for sys in Systems: x1,y1,y1_err=np.random.rand(100),np.random.rand(100 ..

发布时间：2022-09-05 15:16:50 python pandas dataframe hdf5 h5py Python

编写用于在Java中的Map中查找的UDF会给出不受支持的文本类型类java.util.HashMap

我使用的是带有Spark v2.4.1的java8 我正在尝试使用UDF来使用映射查找，如下所示数据： +-----+-----+-----+ |code1|code2|code3| +-----+-----+-----+ |1 |7 | 5 | |2 |7 | 4 | |3 |7 | 3 | |4 |7 | 2 ..

发布时间：2022-09-04 17:07:20 dataframe java-8 apache-spark-sql user-defined-functions 其他开发

高效地定位数据框中的分组常量列。

如何有效地从数据框中提取按组排列的常量列？我在下面包含了一个plyr实现，以精确地说明我想要做的事情，但速度很慢。我怎样才能尽可能高效地做这件事呢？(理想情况下，根本不分割数据帧)。 base ..

发布时间：2022-09-03 16:16:29 r dataframe plyr 其他开发

dataframe相关内容