dataframe相关内容

使用skLearning IterativeImputer类为鼠标输入遗漏的值

我正在尝试学习如何实现MICE来输入我的数据集的缺失值。我听说过Fancyimpute的鼠标,但我也读到Sklearn的IterativeImputer类可以实现类似的结果。摘自SkLearning的文档: 我们实现IterativeImputer的灵感来自R MICE Package(链式方程的多元推算)[1],但是 与它的不同之处在于,它返回单个补偿而不是多个 推卸责任。但是,Itera ..
发布时间:2022-09-02 14:55:03 Python

SkLearning PCA:正确的PC维度

我有一个数据帧df,它包含一个名为‘Event’的列,其中有一个24x24x40数值数组。我想: 提取此数字数组; 将其展平为1x23040向量; 将此条目作为列添加到新的Numpy数组或数据帧中; 对结果矩阵执行PCA。 但是,PCA生成的特征向量的维度为“条目数”,而不是“数据中的维度数”。 为了说明我的问题,我演示了一个运行良好的最小示例: 示例1 fro ..
发布时间:2022-08-28 21:51:16 Python

如何在有基本事实的情况下,仅为数据帧找到正确的正值?

首先,对于冗长的描述,我深表歉意,但我希望每个人都能理解我所做的事情。 我正在研究一个检测模型,它可以预测14种不同的病理,并且我已经制作了一个对任何新的测试图像进行预测的推理文件。 我和具有25k以上测试图像的数据集已经找到了他们的预测,并制作了一个这样的文件Dataframe。 在此数据框中,我有(了解我的情况的信息很少): image_name______00000003_ ..
发布时间:2022-08-27 19:51:49 Python

如何检查 pandas 数据框是否只包含数字列?

我想检查数据帧中的每一列是否只包含数字。我怎样才能找到它。 推荐答案 您可以使用to_numeric和强制错误进行检查: pd.to_numeric(df['column'], errors='coerce').notnull().all() 对于所有列,您可以遍历列或仅使用apply df.apply(lambda s: pd.to_numeric(s, errors ..
发布时间:2022-08-15 18:08:06 Python

一列的组合之间的公共列

我有来自分析的数据集。为了解释结果,我正在尝试构建数据帧 结果应如下: 基因名称|Motif_id_1|Motif_id_2|发生|匹配序列 此处某些Motif_id可能共享gene_name,且结果应该是Motif_id的两个组合(允许重叠)。 我尝试了以下代码,但结果未给出Motif_id内的组合。 merge_practice ..
发布时间:2022-08-13 18:08:56 其他开发

大数据如何计算R中的距离集?

问题:我们需要一种大数据方法来计算点之间的距离。我们在下面用五个观测数据框概述我们想要做的事情。但是,由于行数变大(>;100万),这种特定的方法是不可行的。在过去,我们使用SAS来进行这种分析,但如果可能的话,我们更倾向于使用R。(注意:我不打算显示代码,因为虽然我在下面概述了一种在较小的数据集上执行此操作的方法,但这基本上不可能用于我们规模的数据。) 我们从商店的数据帧开始,每个商店 ..
发布时间:2022-08-04 14:26:14 其他开发