machine-learning相关内容
我正在对970个样本进行培训,并对243个样本进行验证。 在KERAS中拟合模型以优化val_acc时,批大小和纪元数应该有多大?是否有任何基于数据输入大小的经验法则可供使用? 推荐答案 因为您的数据集非常小(大约1,000个样本),所以使用批大小为32可能是安全的,这是非常标准的。它不会对你的问题产生巨大的影响,除非你在进行数十万或数百万次的观察训练。 回答您有关批次大小和纪
..
如何比较2个不同 pandas 数据框的列名。我想比较测试数据帧中缺少某些列的列车数据帧和测试数据帧?? 推荐答案 pandas.Index对象(包括数据框列)具有有用的set类方法,如intersection和difference。 例如,给定数据帧train和test: train_cols = train.columns test_cols = test.column
..
作为Deep Learning的新手,我正在努力理解不同技术状态的算法及其用途之间的差异。就像RESNET或VGG与yolo或rcnn系列有什么不同。它们是这些检测模型的子组件吗?固态硬盘是否也是像yolo或rcnn这样的另一个系列? 推荐答案 Resnet是一族神经网络(使用残差函数)。很多神经网络使用ResNet架构,例如: ResNet18、ResNet50 宽ResNe
..
您好,我正在尝试一个非常简单的项目来了解TensorFlow中的工作原理。我只给了3个简单的数组,它找不到给我一个错误之间的关系。为什么会这样,如何克服呢?以下是我的代码 import tensorflow as tf from tensorflow import keras x = [[1,2,5,6],[12,5,1,7],[1,5,7,9]] y = [[1],[4],[3]] m
..
对于这里的图像curve_fit for as single exponential curve所示的单个指数曲线,我可以使用scipy.Optimize.curveFit来拟合数据。然而,我不确定如何实现对这里所示的由多个指数曲线组成的相似数据集的拟合double exponential curves。 我使用以下方法实现了对单曲线的拟合: def exp_decay(x,a,r):
..
我正在训练Keras(python,后端:TensorFlow)中的神经网络作为回归。因此,我的输出层不包含激活函数,并且我使用均方误差作为我的损失函数。 我的问题是:我希望确保所有产量估计的总和(几乎)等于所有实际标签的总和。 我的意思是:我不仅要确保每个训练示例i的(Y_Real)^i~(Y_Recast)^i,而且要保证sum(Y_Real)=sum(Y_Recast),对所有i求和
..
我想创建一个可以使用一阶逻辑进行简单推理的应用程序。有没有人能推荐一个“引擎”,它可以接受任意数量的FOL表达式,并允许查询这些表达式(最好是通过Python访问)? 推荐答案 PyLog: PyLog是一阶逻辑库 在Python中包含Prolog引擎。
..
我创建了一个用于Web会话存活预测的CNN-LSTM,我的训练数据如下: print(x_train.shape) (288, 3, 393) (示例、时间步长、功能)和我的模型: model = Sequential() model.add(TimeDistributed(Conv1D(128, 5, activation='relu'),
..
读完这个主题我不太理解:神经网络中的“卷积”与简单的下采样或“锐化”功能相比吗? 您能否将此术语分解为简单易懂的图像/类比? 编辑:在第一个答案之后重新表述:合并是否可以理解为权重矩阵的缩减抽样? 推荐答案 卷积神经网络是一系列经经验证明在图像识别方面非常有效的模型。从这个角度看-CNN与下采样完全不同。 但在CNN设计中使用的框架中有一些可以与下采样技术相媲美的东西
..
我正在为Food-101数据集(图像数据集w/101类和每个类1k图像)构建分类器。我的方法是使用KERAS,并通过ResNet50(来自ImageNet的权重)转移学习。 在训练模型时,训练精度在几个历元(30%-->45%)内有较好的提高,但验证精度基本上保持在0.9%-1.0%。我尝试过简化、交换优化器、减少和增加隐藏层中的单位、剥离所有图像增强,并在flow_from_directory
..
我有一个卷积神经网络,我修改了它的体系结构。我没有时间重新培训和执行交叉验证(在最佳参数上进行网格搜索)。我想直观地调整学习速率。 我应该增加还是降低我的RMS(基于SGD)优化器的学习率,条件是: 我将更多神经元添加到完全连接层? 在卷积神经网络上,我在完全连接之前去除子采样(平均或最大池)层,并增加该特征映射和Softmax输出之间的完全连接单元的数量(以便有更多更多的权重连接到
..
代码 import numpy as np from keras.preprocessing.image import ImageDataGenerator from keras.models import Sequential,Model from keras.layers import Dropout, Flatten, Dense,Input from keras import app
..
我已经使用skLearning Python创建了一个基于KNN的分类算法。 该算法已经创建了4个类,命名为&Quot;1&Quot;、&Quot;2&Quot;、&Quot;3&Quot;、&Quot;4&Quot;。 我想给算法提供一个输入列表,并预测它们可能属于四个类中的哪一个类,并仅打印出属于类&1&q; 的那些输入的列表 正在尝试使用: review_3 = ["Loop","
..
当m是特征量,n是样本量时,python acadkit-Learning站点(http://scikit-learn.org/stable/modules/tree.html)声明构建二叉决策树的运行时是mnlog(N)。 我知道log(N)来自分裂后树的平均高度。我理解,在每次拆分时,您必须查看每个功能(M),然后选择最好的一个进行拆分。我知道这是通过为该节点(N)的每个样本计算一个“最
..
我刚刚在here中读到了Kera权重初始值设定项。在文档中,只介绍了不同的初始值设定项。例如: model.add(Dense(64, kernel_initializer='random_normal')) 我想知道未指定kernel_initializer参数时的默认权重。 有办法访问它吗? 推荐答案 每层都有自己的默认值来初始化权重。对于大多数层,如Dense、卷积、R
..
您好,我正在处理关键点分析任务,该任务由IBM共享,这里是link。在给定的数据集中有多行文本,任何人都可以告诉我如何将文本列转换为张量,并在同一个dataFrame中再次赋值它们,因为那里还有其他列的数据。 问题 这里我面临着一个问题,我以前从未见过这种数据,比如有多个文本列,我如何将所有这些列转换为张量,然后应用一个模型。大多数情况下,数据是这样的:一个文本列 其他栏为标签,例如:电影评论
..
我希望对单个示例或一批示例进行并行化(在我的情况下,我只有CPU,最多可以有112个)。我试过了,但我得到了一个错误,即损失不能从单独的进程中获得梯度(这完全破坏了我的尝试)。我仍然想这样做,重要的是,在多进程处理之后,我可以执行优化器步骤。我怎么才能绕过它呢?我做了一个完全自成体系的例子: import torch import torch.nn as nn from torch.opt
..
我正在处理一个二进制分类问题。在这种情况下,我使用了从skLearning导入的Logistic回归和支持向量机模型。这两个模型用相同的、不平衡的训练数据进行拟合,并调整了类权重。他们也取得了可比的成绩。当我使用这两个预先训练好的模型来预测新的数据集时。LR模型和SVM模型预测的实例数与正数相似。并且预测的实例共享很大的重叠。 然而,当我查看被归类为阳性的概率得分时,LR的分布是从0.5到1,而
..
我正在使用keras学习深度学习,并尝试将结果(准确性)与机器学习算法(sklearn)(即random forest,k_neighbors)进行比较 似乎使用keras我得到的结果最差。 我正在处理简单的分类问题:iris dataset 我的keras代码看起来是: samples = datasets.load_iris() X = samples.data y = sampl
..
我想了解如何识别数据帧组中的统计异常值。我需要按条件对行进行分组,然后将这些组减少到单个行中,然后在所有减少的行中查找离群值。 df = pd.DataFrame({'X0': {0: 1, 1: 1, 2: 1, 3: 1, 4: 0, 5: 1, 6: 1, 7: 1, 8: 0, 9: 1, 10: 0, 11: 1, 12: 0, 13: 1, 14: 1, 15: 1, 16: 0
..