dataframe 第5页 - IT屋-程序员软件开发技术分享社区

如何使用If Else在 pandas 麻木的时候在所有行中快速应用函数

我有一个数据帧df_ia： dod1 dod2 0 0 0 1 200806 0 2 200806 0 3 200806 0 4 200806 0 5 200806 0 6 200806 0 7 200806 0 和用于应用于每一行的函数： def life_status(dod1, dod2): if ..

发布时间：2022-05-26 14:57:52 python pandas dataframe numpy numpy-ndarray Python

在PANDA中使用映射逻辑替换列值(实现函数的问题)

我有一个如下数据框。我想要的是生成另一列(freq)，其中的行将根据以下逻辑具有值：如果模式列值以数字m开头，则在频率列中填写数字n。 - m: 1, n: 12 - m: 6, n: 4 - m: 7, n: 2 - m: 8, n: 1 DataFrame Mode 0 602 1 603 2 700 3 100 4 100 5 100 ..

发布时间：2022-05-26 14:06:06 python pandas dataframe numpy numpy-ndarray Python

如何更快地基于多个条件合并2个 pandas 大 pandas

我有两个数据帧： df1： RB BeginDate EndDate Valindex0 0 00 19000100 19811231 45 1 00 19820100 19841299 47 2 00 19850100 20010699 50 3 00 20010700 99999999 39 ..

发布时间：2022-05-26 13:43:05 python pandas dataframe numpy numpy-ndarray Python

我有一个使用以下代码的散点图 c1 = data_pd[data_pd.cluster == 0] c2 = data_pd[data_pd.cluster == 1] c3 = data_pd[data_pd.cluster == 2] c4 = data_pd[data_pd.cluster == 3] c5 = data_pd[data_pd.cluster == 4] plt.sca ..

发布时间：2022-05-24 19:50:05 dataframe matplotlib pyspark scatter-plot 其他开发

使用python根据条件选择两行或多行连续行

我有一个这样的数据集： user time city cookie index A 2019-01-01 11.00 NYC 123456 1 A 2019-01-01 11.12 CA 234567 2 A 2019-01-01 11.18 ..

发布时间：2022-05-23 15:16:07 python-3.x pandas numpy dataframe data-mining AI人工智能

按总和归一化 pandas DataFrame行

将 pandas DataFrame的每一行标准化的最常用的方法是什么？将列正常化很容易，所以一个(非常难看！)选项为： (df.T / df.T.sum()).T pandas 广播规则禁止df / df.sum(axis=1)这样做推荐答案要解决直播问题，可以使用div方法： df.div(df.sum(axis=1), axis=0) 参见pandas U ..

发布时间：2022-05-18 15:02:23 python pandas normalization dataframe Python

如何删除R中列中每一行的前三个字符

我有一个很大的数据集，其中有一列文本，有20K行。想要删除该特定列中每行开始处的前x个字符(例如3个)。感谢您的帮助。推荐答案可以通过gsub函数和简单的正则表达式来完成。代码如下： # Fake data frame df ..

发布时间：2022-05-15 11:53:34 r dataframe edit gsub subtraction 其他开发

在带有随机字符串值的PANAS中插入新列

我有一个DataFrame A B C 0 1 2 3 1 2 3 3 2 3 2 1 我需要在 pandas DataFrame中创建一个新列，其中‘yes’或‘no’随机填充此列。 A B C NEW 0 1 2 3 yes 1 2 3 3 no 2 3 2 1 no 使用随机选项会导致每一行都有相 ..

发布时间：2022-05-12 10:35:00 python pandas dataframe random series Python

如何高效地将多个 pandas 列组合成一个阵列式的列？

使用类似对象类型的列创建(或加载)DataFrame很容易，如下所示： [In]: pdf = pd.DataFrame({ "a": [1, 2, 3], "b": [4, 5, 6], "c": [7, 8, 9], ..

发布时间：2022-05-12 10:31:08 python pandas dataframe series Python

将多列的数据帧转换为序列

我尝试将数据框转换为序列，但显示以下错误。我使用Pandas.Series(Dataframe)->将Dataframe转换为Series 我想要第一张图像格式的输出推荐答案请尝试以下方法从提到的数据中获取系列对象(假设data是您正在使用的DataFrame) series = pd.Series(data['Sales'], index=data.index) ..

发布时间：2022-05-12 10:10:28 python pandas dataframe series Python

类型错误：不可散列的类型：Pandas DataFrame列

这可能很简单，但我找不到解释，这经常发生在我身上。我正在尝试从列Rate1E中选择超过3.5的值，并查看Pandas DataFrameenergy中符合上述条件的选定行的其余行。我之前有人给了我一个答案，现在简单地改成了如下文字： energy = energy.loc[energy[:, 'Rate1E'] >= 3.5] print(energy.loc[:, 'Rate1E']) ..

发布时间：2022-05-12 09:56:00 python pandas dataframe indexing series Python

在R中将列表列表展平为数据帧时丢失重复的列名

这种将列表展平为数据帧的问题已经被问了几次，但我找不到一个解决方案来解决我的特定问题。下面我举了一个小例子。一般来说，当在R中使用httr从API获取数据时，我用来获取数据的大多数数据API都以类似的嵌套列表格式返回数据，如下所示： nested_list = list( list( name = 'joe', match = 13, team = list( ..

发布时间：2022-05-07 18:50:50 r list dataframe data-manipulation 其他开发

根据列之间的差异过滤数据帧[不是下一列]

我有一个唯一的数据帧df： name val_1 val_2 val_3 val_4 AAA 1 2 3 11 BBB 2 3 5 9 CCC 6 ..

发布时间：2022-05-07 17:18:41 python pandas dataframe data-manipulation Python

基于时间轴递增的局部最小图像过滤数据帧

编辑：我有以下学生数据框，显示他们在不同日期的考试成绩(已排序)： df = pd.DataFrame({'student': 'A A A B B B B C C'.split(), 'exam_date':[datetime.datetime(2013,4,1),datetime.datetime(2013,6,1), ..

发布时间：2022-05-07 16:26:11 python pandas dataframe datetime data-manipulation Python

根据字符串中定义的条件填充新列

我有条件填充在字符串中定义的新列。 condition_string = "colA='yes' & colB='yes' & (colC='yes' | colD='yes'): 'Yes', colA='no' & colB='no' & (colC='no' | colD='no'): 'No', ELSE : 'UNKNOWN'" 可以用任何其他格式(词典)重写/构造字符串，然 ..

发布时间：2022-05-07 16:09:40 python pandas dataframe numpy data-manipulation Python

每个点都有时间序列的点之间的相关性下降

我正在研究如何快速实现计算点之间的相关性(在X、Y、Z中)，并在给定搜索方向的情况下测量相关性何时降至特定阈值以下。我在Calculating correlation between points where each points has a timeseries之前提出了一个相关问题，但我认为我需要重新表述这个问题以使其更清楚。我有平面中点速度的时间历史，例如XZ平面，我想量化用于模拟 ..

发布时间：2022-05-06 09:30:49 python pandas dataframe correlation pearson-correlation Python

滤波相关矩阵R

我在尝试从相关性矩阵中提取数据时遇到了一些困难，我希望提取高于0.8和低于0.99的值，因为我希望排除恰好为1的两只股票的相关性。这是我的代码： #Test #load the packages library(corrr) library(ggplot2) library(ggcorrplot) library(dplyr) library(quantmod) #get ..

发布时间：2022-05-05 23:58:26 r dataframe matrix correlation 其他开发

如何根据Excel Dataframe中的内容突出显示行？

我有一个包含如左图所示数据的EXCEL文件，我正在尝试将其格式化以获取数据格式设置为右侧的表格。使用我当前的代码，我能够格式化包含标题(h1，h2，...)的所有行这是文件的内容。xlsx：这是我当前的代码： import pandas as pd import numpy as np from xlsxwriter.utility import xl_rowco ..

发布时间：2022-04-19 13:11:17 python-3.x pandas dataframe export-to-excel Python

每个月的 pandas 分组和总和

我正在做一个Ploly Dash应用程序，其中有一个用于选择年份的下拉列表。在 pandas 中，我希望按年份对列的值进行分组，并计算该年每列的总和。这样做后，我将能够在下拉列表中选择一个月，并对该月的数据进行筛选以更新Sankey图表。我怎样才能做到这一点？列：[‘Month’]；[‘Value1’]；[‘Value2’]...；[‘Value20’]//我想我必须创建一个新的数据框，在其中我 ..

发布时间：2022-04-19 10:49:47 pandas dataframe plotly plotly-dash plotly-python Python

R：将多个列合并为同一行中的一对列单元

我希望将数据框中的多列组合/配对为同一行中的列单元对。例如，df1应转换为df2。 df1 col1 col2 col3 1 2 3 0 0 1 df2 c1 c2 1 2 1 3 2 3 0 0 0 1 0 1 该解决方案应可针对df1%s(方式)超过三列进行扩展。我想过熔化/重塑/dcast， ..

发布时间：2022-04-18 14:49:30 r dataframe reshape 其他开发

dataframe相关内容