imblearn - IT屋-程序员软件开发技术分享社区

Jupyter:没有名为“imblearn"的模块；安装后

我在 ANACONDA Navigator 上安装了“不平衡学习"(0.3.1 版).当我使用 Jupyter (Python 3) 从不平衡学习网站运行一个示例时，我收到一条关于“ModuleNotFoundError"的消息.没有名为“imblearn"的模块. from imblearn.datasets import make_imbalance从 imblearn.under_samp ..

发布时间：2022-01-10 21:39:43 python-3.x anaconda imblearn 其他开发

SMOTE 初始化期望 n_neighbors <= n_samples，但 n_samples <;n_neighbors

我已经预先清理了数据，下面是前4行的格式: [IN] df.head()[OUT] 清洁年0 1909 熟人收据跟随文员皇冠...1 1909 询问国务秘书国战是否发出声明...2 1909 年我乞求小标志向上的机动车驾驶...3 1909 我想问问国务卿国战少尉...4 1909问国务秘书国战是否会引入... 我按如下方式调用了 train_test_split(): [IN] X_t ..

发布时间：2021-12-25 14:43:30 scikit-learn knn tf-idf oversampling imblearn 其他开发

使用 imblearn 管道进行交叉验证之前或之后是否会发生过采样?

在对训练数据进行交叉验证以验证我的超参数之前，我已将我的数据拆分为训练/测试.我有一个不平衡的数据集，想在每次迭代中执行 SMOTE 过采样，所以我使用 imblearn 建立了一个管道. 我的理解是应该在将数据分成k-fold后进行过采样，以防止信息泄露.在下面的设置中使用 Pipeline 时，是否保留了这种操作顺序(数据拆分为 k 折、k-1 折过采样、预测剩余折叠)? from i ..

发布时间：2021-07-16 20:07:16 python-3.x scikit-learn xgboost imblearn 其他开发

重采样数据 - 使用来自 imblearn 的 SMOTE 和 3D numpy 数组

我想重新采样我的数据集.这包括带有 3 个类别标签的分类转换数据.每类样本量为: A 类计数:6945 B 类计数:650 C 类计数:9066 样本总数:16661 没有标签的数据形状是 (16661, 1000, 256).这意味着 (1000,256) 的 16661 个样本.我想要的是将数据上采样到多数类的样本数，即 A 类 -> (6945) 但是，调用时: f ..

发布时间：2021-06-10 19:31:41 python numpy imblearn Python

如何从imblearn中的RandomUnderSampler获取样本索引

有人通过imblearn的RandomUnderSampler进行欠采样后，是否知道如何/如何获得所选样本的索引?以前有一个参数"return_indices = True"，现在已为新版本删除了该参数，并假定已将其替换为属性"sample_indices_".但是，如果我尝试使用该属性，它将无法正常工作(请参见下面的代码).我正在使用imblearn 0.6.2.版. russs = Ran ..

发布时间：2021-05-31 18:42:01 python machine-learning imblearn AI人工智能

在imblearn管道中使用SMOTENC实现FAMD时发生AttributeError

我正在尝试使用FAMD，SMOTENC和其他预处理步骤来实现管道.但是每次都会出错.如果我从管道中删除FAMD，则效果很好. 我的代码: #将数据集分为两部分num_df = X_train_new.select_dtypes(include = [np.number]).列cat_df = X_train_new.select_dtypes(exclude = [np.number]). ..

发布时间：2021-05-31 18:41:58 python machine-learning scikit-learn imblearn AI人工智能

SMOTE为所有类别的数据集提供数组大小/ValueError

我正在使用SMOTE-NC对我的分类数据进行过采样.我只有1个功能和10500个样本. 在运行以下代码时，出现错误: ---------------------------------------------------------------------------ValueError Traceback(最近一次通话) ..

发布时间：2021-05-31 18:38:14 python machine-learning imbalanced-data imblearn smote AI人工智能

如何使用Python对图像数据集进行过采样?

我正在处理一个不平衡的图像数据集(不同类)的多类分类问题.我尝试了 imblearn 库，但是它不适用于图像数据集. 我有一个图像数据集，它属于3类，即A，B，C.A有1000个数据，B有300个数据，C有100个数据.我想对B和C类进行过采样，以便避免数据不平衡.请让我知道如何使用python对图像数据集进行过度采样. 解决方案感谢您的澄清.通常，您不要使用Python进行过采样 ..

发布时间：2021-04-29 20:49:05 python-3.x machine-learning deep-learning computer-vision imblearn AI人工智能

RandomUnderSampler'对象没有属性'fit_resample'

我正在使用imblearn中的RandomUnderSampler，但是出现以下错误.有任何想法吗?谢谢 from imblearn.under_sampling import RandomUnderSampler print('Initial dataset shape %s' % Counter(y.values.squeeze())) rus = RandomUnderSampler( ..

发布时间：2021-02-09 18:58:17 python jupyter-notebook jupyter imblearn Python

与Imblearn管道和GridSearchCV进行交叉验证

我正在尝试使用imblearn和GridSearchCV中的Pipeline类来获得最佳参数，以对不平衡数据集进行分类.根据提到的答案此处，我想不对验证集进行重采样，而仅对训练集进行重采样，而imblearn的Pipeline似乎正在这样做.但是，在实施接受的解决方案时出现错误.请让我知道我在做什么错.下面是我的实现: def imb_pipeline(clf, X, y, params) ..

发布时间：2020-05-28 00:44:57 python-3.x scikit-learn pipeline imblearn 其他开发

SMOTE初始化期望n_neighbors< = n_samples，但是n_samples< n_邻居

我已经预先清理了数据，下面显示了前4行的格式: [IN] df.head() [OUT] Year cleaned 0 1909 acquaint hous receiv follow letter clerk crown... 1 1909 ask secretari state war whether is ..

发布时间：2020-04-26 11:02:18 scikit-learn knn tf-idf oversampling imblearn 其他开发

Jupyter:没有名为"imblearn"的模块安装后

我在ANACONDA Navigator上安装了“不平衡学习"(版本0.3.1). 当我使用Jupyter(Python 3)在不平衡学习网站上运行示例时，我收到一条有关"ModuleNotFoundError"的消息.没有名为"imblearn"的模块. from imblearn.datasets import make_imbalance from imblearn.under_sam ..

发布时间：2020-04-25 06:46:34 python-3.x scikit-learn jupyter-notebook anaconda imblearn 其他开发

imblearn相关内容