neural-network相关内容

激活函数的导数和在反向传播中的应用

我正在阅读这个文档,他们表示权重调整公式是这样的: 新权重 = 旧权重 + 学习率 * delta * df(e)/de * 输入 df(e)/de 部分是激活函数的导数,通常是类似于tanh 的sigmoid 函数. 这究竟是为了什么? 为什么我们还要乘以它? 为什么仅仅学习率*增量*输入不够? 这个问题是在这个问题之后出现的,并与之密切相关:为什么必须在反向传播神经 ..

如何拆分训练和测试数据 - Tensorflow 上的 Keras

我目前正在使用神经网络和拟合函数训练我的数据. history=model.fit(X,encoded_Y,batch_size=50,nb_epoch=500,validation_split=0.2,verbose=1) 现在我使用了validation_split 作为20%.我的理解是我的训练数据将是 80%,测试数据将是 20%.我很困惑如何在后端处理这些数据.是将前 80% 的样本 ..

如何在 Keras 中解释 LSTM 层中的权重

我目前正在使用 LSTM 层训练用于天气预报的循环神经网络.网络本身非常简单,大致如下所示: model = Sequential()model.add(LSTM(hidden_​​neurons, input_shape=(time_steps, feature_count), return_sequences=False))模型.添加(密集(特征计数))模型.添加(激活(“线性")) LS ..
发布时间:2021-12-31 16:53:27 Python

softmax 函数解释的导数

我正在尝试计算 softmax 激活函数的导数.我发现了这个:https://math.stackexchange.com/questions/945871/derivative-of-softmax-loss-function 似乎没有人对我们如何得到 i=j 和 i!= j 的答案给出正确的推导.有人可以解释一下吗!当求和涉及到 softmax 激活函数的分母时,我对导数感到困惑. 解决 ..
发布时间:2021-12-31 16:53:12 其他开发

如何在 Tensorflow 中关闭 dropout 以进行测试?

总的来说,我对 Tensorflow 和 ML 还很陌生,所以我在此为一个(可能的)微不足道的问题道歉. 我使用 dropout 技术来提高我的网络的学习率,它似乎工作得很好.然后,我想在一些数据上测试网络,看看它是否像这样: def Ask(self, image):返回 self.session.run(self.model, feed_dict = {self.inputPh: i ..

卷积神经网络 Conv1d 输入形状

我正在尝试创建一个 CNN 来对数据进行分类.我的数据是 X[N_data, N_features]我想创建一个能够对其进行分类的神经网络.我的问题是关于 keras 后端的 Conv1D 的输入形状. 我想重复一个过滤器......假设有 10 个特征,然后对接下来的 10 个特征保持相同的权重.对于每个数据,我的卷积层将创建 N_features/10 个新神经元.我该怎么做?我应该在 ..

在 R 中使用神经网络进行时间序列预测的示例

任何人都有一个简短的教育示例,如何使用神经网络(R 中的 nnet)进行预测?这是一个在 R 中的时间序列示例 T = seq(0,20,length=200)Y = 1 + 3*cos(4*T+2) +.2*T^2 + rnorm(200)情节(T,Y,类型=“l") 非常感谢 大卫 解决方案 我认为你可以使用 caret 包,特别是 train 函数 这个函数为一个数字设置 ..
发布时间:2021-12-31 16:52:42 其他开发

使用 LSTM 循环网络进行 Pybrain 时间序列预测

我有一个问题,它与使用 pybrain 进行时间序列回归有关.我计划使用 pybrain 中的 LSTM 层来训练和预测时间序列. 我在下面的链接中找到了一个示例代码 请求例如:用于预测序列中下一个值的循环神经网络 在上面的例子中,网络能够在训练后预测一个序列.但问题是,网络通过一次性将所有顺序数据送入输入层来接收所有顺序数据.例如,如果训练数据每个有 10 个特征,则这 10 ..
发布时间:2021-12-31 16:52:37 Python

用于电子邮件垃圾邮件检测的神经网络

假设您可以访问一个电子邮件帐户,该帐户将过去几年收到的电子邮件的历史记录(约 10k 封电子邮件)分为 2 组 真正的电子邮件 垃圾邮件 您将如何完成创建可用于垃圾邮件检测的神经网络解决方案的任务 - 基本上将任何电子邮件分类为垃圾邮件或非垃圾邮件? 假设电子邮件提取已经到位,我们只需要关注分类部分. 我希望得到回答的要点是: 选择哪些参数作为神经网络的输入,为什么 ..

神经网络:什么是“线性可分"?意思是?

我目前正在阅读 Tom Mitchell 的《机器学习》一书.在谈到神经网络时,Mitchell 说: "虽然感知器规则找到了一个成功的权重向量,当训练样本是线性可分的,它可能无法收敛如果样本不是线性可分的." 我在理解“线性可分"的含义时遇到问题?维基百科告诉我“二维空间中的两组点如果可以被一条线完全分开,则它们是线性可分的." 但这如何应用于神经网络的训练集?输入(或动作单元 ..
发布时间:2021-12-31 16:52:19 AI人工智能

神经网络的 softmax 激活函数的实现

我在神经网络的最后一层使用 Softmax 激活函数.但是我在安全实现这个函数方面遇到了问题. 一个简单的实现是这样的: 向量 y = mlp(x);//没有softmax激活函数的神经网络的输出for(int f = 0; f 100 个隐藏节点效果不佳,因为在许多情况下 y 将是 ..
发布时间:2021-12-31 16:52:05 C/C++开发

使用 RELU 的神经网络反向传播

我正在尝试使用 RELU 实现神经网络. 输入层 -> 1 个隐藏层 -> relu -> 输出层 -> softmax 层 以上是我的神经网络的架构.我对这个 relu 的反向传播感到困惑.对于 RELU 的导数,如果 x 0,则输出为 1.所以当你计算梯度时,这是否意味着如果 x 有人可以“逐步"解释我的神经网络架构的反向传播吗? 解决方案 如果 x 0,则输出为 1 ..
发布时间:2021-12-31 16:51:57 其他开发

为什么在 Keras 中预测需要批量大小?

在 Keras 中,为了预测数据测试的类别,使用了 predict_classes(). 例如: classes = model.predict_classes(X_test,batch_size=32) 我的问题是,我知道batch_size在训练中的用法,但是为什么它需要一个batch_size来进行预测?它是如何工作的? 解决方案 Keras 可以同时预测多个值,就像你输入 ..
发布时间:2021-12-31 16:51:51 其他开发

如何在 TensorFlow 中调试 NaN 值?

我正在运行 TensorFlow,但我碰巧有一些产生 NaN 的东西.我想知道它是什么,但我不知道如何做到这一点.主要问题是,在“正常"过程程序中,我只会在执行操作之前编写一个打印语句.TensorFlow 的问题是我不能这样做,因为我首先声明(或定义)了图形,因此向图形定义添加打印语句无济于事.是否有任何规则、建议、启发式方法或任何方法可以追踪可能导致 NaN 的原因? 在这种情况下,我更 ..

在预测过程中,数据规范化在 keras 中是如何工作的?

我看到 imageDataGenerator 允许我指定不同风格的数据规范化,例如featurewise_center、samplewise_center 等 我从示例中看到,如果我指定这些选项之一,那么我需要调用生成器上的 fit 方法,以便允许生成器计算统计数据,例如生成器上的平均图像. (X_train, y_train), (X_test, y_test) = cifar10.lo ..

给定足够多的隐藏神经元,神经网络能否逼近任何函数?

我知道具有任意数量隐藏层的神经网络可以逼近非线性函数,但是,它可以逼近: f(x) = x^2 我想不出怎么会这样.这似乎是神经网络的一个非常明显的局限性,它可能会限制它的功能.例如,由于这种限制,神经网络可能无法正确逼近许多用于统计的函数,例如指数移动平均数,甚至方差. 说到移动平均线,循环神经网络能正确地近似吗?我了解前馈神经网络甚至单个线性神经元如何使用滑动窗口技术输出移动平均值, ..
发布时间:2021-12-31 16:50:55 AI人工智能