rnn相关内容

PyTorch:传递 numpy 数组进行权重初始化

我想用np数组初始化RNN的参数. 在下面的示例中,我想将 w 传递给 rnn 的参数.我知道pytorch提供了很多初始化方法,比如Xavier、uniform等,但是有没有办法通过传递numpy数组来初始化参数呢? 将 numpy 导入为 np将火炬导入为 nnrng = np.random.RandomState(313)w = rng.randn(input_size, hidde ..
发布时间:2022-01-19 00:04:15 Python

我们如何分析损失与纪元图?

我正在训练一个语言模型,每次训练时都会绘制损失与时期的关系图.我附上了两个样本. 显然,第二个表现更好.但是,从这些图中,我们什么时候决定停止训练(提前停止)? 我们能否从这些图中理解过度拟合和欠拟合,或者我是否需要绘制额外的学习曲线? 从这些图中可以做出哪些额外的推论? 解决方案 第一个结论显然第一个模型的性能比第二个差,这通常是正确的,只要你使用相同的数据验证.如果您 ..
发布时间:2022-01-06 19:41:03 AI人工智能

PyTorch:传递 numpy 数组以进行权重初始化

我想用 np 数组初始化 RNN 的参数. 在下面的例子中,我想将w传递给rnn的参数.我知道pytorch提供了很多初始化方法,比如Xavier、uniform等,但是有没有办法通过传递numpy数组来初始化参数? 将 numpy 导入为 np将火炬导入为 nnrng = np.random.RandomState(313)w = rng.randn(input_size, hidden ..
发布时间:2022-01-06 19:09:28 Python

理解一个简单的 LSTM pytorch

导入torch,ipdb将 torch.autograd 导入为 autograd将 torch.nn 导入为 nn导入 torch.nn.functional 作为 F导入 torch.optim 作为 optim从 torch.autograd 导入变量rnn = nn.LSTM(input_size=10, hidden_​​size=20, num_layers=2)输入 = 变量(tor ..
发布时间:2021-12-31 16:50:47 其他开发

使用 LSTM(python) 在时间序列中进行模式识别

我的应用场景和上一个类似时间序列中的模式识别 通过处理时间序列数据集,我想检测与此类似的模式:以样本时间序列为例,我希望能够检测此处标记的模式: 但我想用 python 和 LSTM 来做这件事. 我已经阅读了一些关于 RNN 时间序列和词分类的资源.我知道 RNN 如何预测时间序列中的结果,但我很困惑如何在时间序列中找到模式. 我在网上找了很久.但是没有用.请帮助或尝试提 ..

GRU 相同的配置但以两种不同的方式在 tensorflow 中产生两种不同的输出

我想使用 GRU 在 tensorflow 中做一些序列预测.所以我用两种不同的方式创建了相同的模型,如下所示: 在模型 1 中,我有 2 个 GRU,一个接一个,即 new_state1,第一个 GRU 的最终隐藏状态,作为第二个 GRU 的初始状态.因此,模型依次输出 new_state1 和 new_state2.请注意,这不是 2 层模型,而是只有 1 层.从下面的代码中,我将输入和 ..
发布时间:2021-07-05 18:59:57 Python

如何在 Tensorflow RNN 中构建嵌入层?

我正在构建一个 RNN LSTM 网络,以根据作者的年龄(二元分类 - 年轻/成人)对文本进行分类. 似乎网络没有学习,突然开始过度拟合: 红色:火车 蓝色:验证 一种可能是数据表示不够好.我只是按照它们的频率对独特的词进行排序并给它们索引.例如: 未知 ->0->1->2.->3到->4 所以我试图用词嵌入替换它.我看到了几个例子,但我无法在我的代码中实现它.大多数示例如 ..
发布时间:2021-07-05 18:59:34 Python

BasicRNNCell 中的内部变量

我有以下示例代码来测试 BasicRNNCell.我想得到它的内部矩阵,以便我可以使用我自己的代码计算 output_res、newstate_res 的值,以确保我可以重现 output_res、newstate_res. 在 tensorflow 源代码中,它说 output = new_state = act(W * input + U * state + B).有人知道我如何获得 W ..
发布时间:2021-07-05 18:59:25 Python

Python 在 GCP 上被杀死

我一直致力于比较以在本地机器和 Google Cloud Platform 上运行深度学习代码.代码是关于循环神经网络的,它在本地机器上运行得非常好.但是在GCP cloud shell上,当我想编译我的python文件时,它显示“Killed" userID@projectID:~$ python rnn.py 被杀 是不是因为我内存不足?(因为我尝试逐行运行,第二次将大数据分 ..
发布时间:2021-07-05 18:59:13 Python

Tensorflow RNN-LSTM - 重置隐藏状态

我正在构建一个用于语言识别的有状态 LSTM.作为有状态的,我可以用较小的文件训练网络,一个新的批次就像讨论中的下一句话.但是,为了使网络得到正确训练,我需要在某些批次之间重置 LSTM 的隐藏状态. 我正在使用一个变量来存储 LSTM 的 hidden_​​state 以提高性能: 与 tf.variable_scope('Hidden_​​state'):hidden_​​state ..
发布时间:2021-07-05 18:59:10 其他开发

在 R 中使用 RNN (Keras) 进行时间序列预测

我正在关注 Chollet 的深度学习与 R 方法(将 RNN 拟合到时间序列数据) 用于拟合 RNN 进行时间序列预测. model %layer_gru(单位= 32,辍学= 0.1,recurrent_dropout = 0.5,return_sequences = TRUE,input_shape = list(NULL, dim(data)[[-1]])) %>%layer_gru(单 ..
发布时间:2021-07-05 18:59:01 其他开发