dataframe 第8页 - IT屋-程序员软件开发技术分享社区

如何使用嵌套词典计算百分比

我纠结于如何使用嵌套词典计算百分比。我有一个old_dict = {'X': {'a': 0.69, 'b': 0.31}, 'Y': {'a': 0.96, 'c': 0.04}}定义的dictionay，我知道X和Y的百分比在表中： input= {"name":['X','Y'],"percentage":[0.9,0.1]} table = pd.DataFrame(input) ..

发布时间：2022-04-09 23:12:59 python pandas dataframe dictionary nested-loops Python

根据条件删除组中的最后一行

我想根据条件删除组中的最后一行。我做了以下工作： df=pd.read_csv('file') grp = df.groupby('id') for idx, i in grp: df= df[df['column2'].index[-1] == 'In'] id product date 0 220 in 2014-09-01 1 ..

发布时间：2022-04-08 21:53:41 python pandas dataframe boolean rows Python

如何删除数据帧中包含R中某些单词的行？

我正在尝试删除数据帧中包含特定单词或特定单词序列的行。例如： mydf ..

发布时间：2022-04-08 21:44:22 r dataframe rows words 其他开发

将列堆叠成R中的1列

我有一个数据框，如下所示： ID Time U1 U2 U3 U4 ... 1 20 1 2 3 5 .. 2 20 2 5 9 4 .. 3 20 2 5 6 4 .. . . And I would need to keep it like: ID Time U 1 20 1 1 20 2 1 20 3 1 20 ..

发布时间：2022-04-08 21:37:41 r dataframe rows reshape 其他开发

创建一列来对Python中的数值进行分类

我有一个名为df的pythonDataFrame，它将客户的BMI作为数字包含在一个名为‘BMI’的列中。我想在数据框中添加一个名为‘BMI_CAT’的新列，它是基于数值的BMI类别(即：<；18.5表示体重不足，18.5到24.9表示健康，依此类推)。这就是我尝试的方法，但不起作用。它不喜欢使用“for”。 df['bmi_cat'] = for i in df['bmi'] ..

发布时间：2022-04-06 21:01:58 python pandas dataframe categories Python

如何在Spyder窗口中找到大数据帧的最后记录？

我希望能够在Spyder(Python IDE)窗口中打开数据帧，并快速向下滚动到相对较大的 pandas 数据帧的最后一条记录(表中的134,890条记录)。这很令人沮丧，因为Spyder只从大型表中加载一定数量的记录，向下滚动需要一段时间。有人知道快捷方式或选项可以快速到达数据帧的末尾，而无需编写df.ail()之类的代码吗？下图显示了一个数据帧，数据持续到2018年，但我花了 ..

发布时间：2022-04-05 21:43:32 python pandas dataframe spyder Python

Pandas：将一列与数据帧的所有其他列进行比较

我有一个场景，我让新的主题接受一系列特征的测试，其中结果都是字符串分类值。测试完成后，我需要将新数据集与所有对象的主数据集进行比较，并查找给定阈值的相似性(匹配)(比方说90%)。因此，我需要能够以最佳性能将新数据集中的每个新主题与主数据集中的每一列以及新数据集中的其他主题进行分栏(按主题)比较，因为生产数据集大约有50万列(还在增长)和10,000行。以下是一些示例代码： ..

发布时间：2022-04-05 17:58:17 python pandas dataframe analytics data-science Python

R中的函数内部无法识别的数据

我想知道为什么在下面的allEffects(fit2, ...)调用中无法识别我的data123？有什么解决办法吗？我的R版本4.0.0(2020-04-24)&q；，Windows 10计算机。 Error object 'data123' not found library(effects) m1 ..

发布时间：2022-04-05 16:50:15 r dataframe function eval 其他开发

访问Pandas中的Zip压缩选项至_csv

我在查找可用的压缩选项时遇到问题。在本页底部： to_csv 他们有一个显示两个选项的示例： COMPRESSION_OPTS=DICT(方法=‘ZIP’，存档名称=‘out.csv’) 但我没有看到所有可用选项的列表。在其他地方也找不到。我很想看看完整的清单(假设不止这两个) 目前的最终目标：压缩操作将文件压缩到一个压缩文件中，但所有文件夹也都在该压缩文件中，因此该文件实际上被隐 ..

发布时间：2022-04-05 12:00:46 python pandas dataframe zip export-to-csv Python

如何使用Interpn在数据帧中进行内插？

我正在尝试插入数据帧，但没有成功。我正在使用具有距离标头和风组件标头的数据帧。风分量用20单位差和距离10分开。我希望能够插入到每个单元的1范围内，但我被卡住了。在此之前我没有使用过Scipy，我在他们的文档中看不到太多的解释(我可以理解)。我有一个我转换的表to_dict并将其用于数据帧： data = {'dist': [100, 110, 120, 130, 1 ..

发布时间：2022-04-04 21:22:50 python pandas dataframe scipy interpolation Python

如何将内联数据集(增量)的参数化链接服务的参数传递到数据流？

我在数据流中有一个增量数据源。为了连接到它，我需要使用参数化的链接服务；但是，我找不到哪里可以为链接的服务参数值寻址：参数在下面的屏幕截图中突出显示：在数据流中，我看不到任何提示来解决我的参数值：谢谢：) 推荐答案当您创建Delta Lake链接服务时，它会显示为您没有提供参数！以下是我认为有意义的：Delta格式仅作为内联数据集可用。因为Delta La ..

发布时间：2022-04-04 18:23:48 dataframe azure-data-factory dataflow delta-lake 其他开发

如何使Pandas DataFrame(Python)以二维(2D)矩阵格式显示每个单元格

我正在尝试使用在Python中导入的MatLab结构创建二维(2-D)数据结构。当我使用Pandas.DataFrame时，每个单元格都包含一个矩阵，但是它们以列表格式显示。我正在尝试将其更改为矩阵格式。使用以下代码时，Python中的DataFrame将类似于： (然而，它并不相同，因为实际数据是从MatLab导入的，并且具有不同的类型，而我不能使用python重新创建它) ..

发布时间：2022-04-03 21:04:47 python pandas dataframe matrix cell Python

通过to_hdf将 pandas 数据帧对象写入hdf5会创建axis0、axis1、lock0_Items和lock0_Values，但为什么呢？

我有一个名为test.csv的CSV文件，内容如下： d,t,s,A,B 2021293,010000,.189545,-9.3868122,46.152637 2021293,010000,.388550,-9.3991013,46.22963 2021293,010000,.588547,-9.350419,46.189907 2021293,010000,.788544,-9.3768 ..

发布时间：2022-04-02 12:44:17 python pandas dataframe octave hdf5 Python

在R中用逗号将字符串拆分成多列

我是R的新手。我有一列(是的，只有一列)，有200行，其元素是用逗号分隔的字符串。实际数据： "A, B, C, D" "1, 10, 13, 4" "0, 1, 6, 1" "9, 3, 3, 0" ... 我想从这一列生成以下数据框： A B C D 1 10 13 4 0 1 6 1 9 3 3 0 ... ..

发布时间：2022-04-01 10:45:32 r string dataframe split multiple-columns 其他开发

将每列中的值乘以另一数据中的权重。R中的框

我有两个data.frames：df和weights(代码如下)。 df如下所示： id a b d EE f 1 this 0.23421153 -0.02324956 0.5457353 0.73068586 0.5642554 2 ..

发布时间：2022-04-01 10:29:46 r dataframe multiple-columns multiplication 其他开发

如何通过一次读取一行的方式在 pandas Dataframe中调换数据？

在 pandas 数据框中： contig haplotype_block hap_X hap_Y odds_ratio My_hap Sp_hap 2 726 C-G-C T-C-T 0.012 C-G-C T-C-T 2 1094 G-C A-T 0.02 ..

发布时间：2022-04-01 10:23:14 python pandas dataframe multiple-columns transpose Python

如何在 pandas 中将日期列拆分为单独的日、月、年列

我有一个数据集df： Dewptm Fog Humidity Pressurem Tempm Wspdm Rainfall datetime_utc 1996-11-01 11.666667 0.0 52.916667 -2659.666667 22.333333 ..

发布时间：2022-04-01 10:20:15 python pandas datetime dataframe multiple-columns Python

pandas 适用，但仅适用于满足条件的行

我想使用Pandasdf.apply，但仅用于某些行举个例子，我想做这样的事情，但我的实际问题有点复杂： import pandas as pd import math z = pd.DataFrame({'a':[4.0,5.0,6.0,7.0,8.0],'b':[6.0,0,5.0,0,1.0]}) z.where(z['b'] != 0, z['a'] / z['b'].app ..

发布时间：2022-03-30 09:46:58 python pandas dataframe apply Python

在数据帧中查找一系列规则，其中包含中断规则

我展示了如何实现此算法，我将其分为两个步骤第一步顺序搜索第二步检查违规规则 set.seed(123) dat ..

发布时间：2022-03-28 21:33:22 r dataframe sequence rules 其他开发

Python Pandas，从.groupby().Apply()中的GROUP中分割行

我有以下代码设置，它们调用和分组By并应用于一个Python Pandas DataFrame。奇怪的是，如果不完全破坏输出(如调试中所示)，我无法按行分割分组的数据(如df.loc[2:5])，如何删除行并使其提供所需的输出？任何帮助都将不胜感激，我正在用更复杂的函数在一个更大的示例中运行此程序，但已将问题精确定位到行切片！编码： import pandas as ..

发布时间：2022-03-26 21:52:12 python pandas group-by dataframe slice Python

dataframe相关内容