deep-learning 第6页 - IT屋-程序员软件开发技术分享社区

如何连接词向量形成句子向量

我在一些文章(Tomas Mikolov...)中了解到，形成句子向量的更好方法是连接词向量. 但是由于我的数学很笨拙，我仍然不确定细节. 例如假设词向量的维数为m；并且一个句子有 n 个单词. 连接操作的正确结果是什么? 它是 1 x m*n 的行向量吗?还是一个 m x n 的矩阵? 解决方案组合嵌入向量至少有三种常用的方法；(a) 求和，(b) 求和 ..

发布时间：2022-01-02 18:00:48 machine-learning deep-learning nlp word2vec AI人工智能

用于 Caffe 的 Python 或 Matlab?

我将致力于在 Caffe 中实现 DQN 和来自 Google DeepMind 的最新扩展. 为此，我将编写一个模拟器(代替 Atari 模拟器)来为代理创建培训体验. 我的问题是:Caffe 的 Matlab 或 Python 接口中哪个最成熟且运行良好? 为此任务在 Python 和 Matlab 之间进行选择还有其他考虑吗? 应该注意的是，我在 Python 开发方面比 ..

发布时间：2021-12-31 17:11:07 python matlab neural-network deep-learning caffe Python

Caffe:如果两层反向传播梯度到同一个底部 blob 会发生什么?

我想知道如果我有一个生成底部 blob 的层，该层会被两个后续层进一步消耗，这两个层都会在反向传播阶段生成一些梯度来填充 bottom.diff.两个梯度会加起来形成最终的梯度吗?或者，只有其中一个可以存活?在我的理解中，Caffe 层需要在用一些计算的梯度填充之前将 bottom.diff 设置为全零，对吗?memset 会清除其他层已经计算的梯度吗?谢谢！解决方案使用多个损失层并不 ..

发布时间：2021-12-31 17:10:58 machine-learning neural-network deep-learning caffe gradient-descent AI人工智能

我正在训练一个小型网络，训练似乎进行得很顺利，val loss 减少，我达到了 80 左右的验证准确率，一旦没有更多改进，它实际上停止了训练(耐心 = 10).它训练了 40 个 epoch.然而，它一直只为每个测试图像预测一个类！我尝试随机初始化 conv 层，我添加了正则化器，我从 Adam 切换到 SGD，我添加了 clipvalue，我添加了 dropouts.我也切换到了 softmax ..

发布时间：2021-12-31 17:10:31 keras neural-network deep-learning conv-neural-network training-data 其他开发

如何在 Tensorflow 中更新 2D 张量的子集?

我想更新值为 0 的二维张量中的索引.所以数据是一个二维张量，其第 2 行第 2 列索引值将被 0 替换.但是，我收到了类型错误.有人可以帮我吗? TypeError: Input 'ref' of 'ScatterUpdate' Op 需要左值输入 data = tf.Variable([[1,2,3,4,5], [6,7,8,9,0], [1,2,3,4,5]])data2 = tf. ..

发布时间：2021-12-31 17:09:25 python neural-network tensorflow deep-learning Python

Caffe 输出层数精度

我修改了 Caffe MNIST 示例以对 3 类图片.我注意到的一件事是，如果我将输出层的数量指定为 3，那么我的测试准确度会急剧下降——下降到 40% 的低范围.但是，如果我 +1 并且有 4 个输出层，则结果在 95% 范围内. 我在我的数据集中添加了一个额外的图像类(所以 4 个类)并注意到同样的事情 - 如果输出层的数量与类的数量相同，那么结果是可怕的，如果它是相同的 +1，然后效果 ..

发布时间：2021-12-31 17:08:43 machine-learning computer-vision neural-network deep-learning caffe AI人工智能

Keras 自定义指标迭代

我对 Keras 还很陌生，我正在尝试定义自己的指标.它计算一致性指数，这是回归问题的度量. def cindex_score(y_true, y_pred):总和 = 0对 = 0对于范围内的 i(1, len(y_true)):对于范围内的 j (0, i):如果我不是 j:如果(y_true[i] > y_true[j]):对 +=1sum += 1* (y_pred[i] > y_pre ..

发布时间：2021-12-31 17:08:22 python neural-network deep-learning keras Python

AttributeError: 在使用自定义生成器的 Keras 模型上调用 fit 时，'tuple' 对象没有属性 'rank'

我想构建一个具有两个输入的神经网络:用于图像数据和数字数据.所以我为此编写了自定义数据生成器.train 和 validation 数据帧包含 11 列: image_name — 图像的路径； 9 个数字特征； target — 项目的类(最后一列). 自定义生成器的代码(基于这个答案): target_size = (224, 224)批量大小 = 1train_datage ..

发布时间：2021-12-31 17:08:09 python tensorflow keras deep-learning neural-network Python

Keras VGG16 微调

keras==2.0.0 和 theano 后端. 注意:我使用了来自 gist 和 applications.VGG16 实用程序的示例，但在尝试连接模型时遇到问题，我对 keras 函数式 API.所以我在这里提供的这个解决方案是最“成功"的一个，即它只在拟合阶段失败. 更新 #1 好的，这是关于我正在尝试做的事情的一个小解释.首先，我从 VGG16 生成瓶颈特征如下: d ..

发布时间：2021-12-31 17:07:45 python neural-network keras deep-learning vgg-net Python

训练神经网络时资源耗尽 - keras

我有一个包含 65668 个文件的数据集. 我将 Keras 用于 CNN，这些是我的层: embedding_layer = Embedding(len(word_index) + 1,EMBEDDING_DIM，权重=[embedding_matrix]，输入长度=MAX_SEQUENCE_LENGTH，可训练=真)序列输入=输入(形状=(MAX_SEQUENCE_LENGTH，)，d ..

发布时间：2021-12-31 17:06:33 tensorflow machine-learning neural-network deep-learning keras AI人工智能

MNIST Pytorch 中的验证错误意外增加

我对整个领域有点陌生，因此决定研究 MNIST 数据集.我几乎改编了 https://github.com/的整个代码pytorch/examples/blob/master/mnist/main.py，只有一个重大变化:数据加载.我不想在 Torchvision 中使用预加载的数据集.所以我使用了 CSV 中的 MNIST. 我通过继承 Dataset 并创建一个新的数据加载器从 CSV ..

发布时间：2021-12-27 17:33:20 python deep-learning pytorch mnist Python

softmax 版本的triplet loss 的梯度计算

我一直在尝试在中描述的Caffe中实现三元组损失的softmax版本Hoffer 和 Ailon，使用三元组网络的深度度量学习，ICLR 2015. 我已经尝试过这个，但我发现很难计算梯度，因为指数中的 L2 不是平方. 有人可以帮我吗? 解决方案使用现有的 caffe 层实现 L2 规范可以为您省去所有麻烦. 这是在 caffe 中为“bottom"s x1 和 ..

发布时间：2021-12-27 17:33:12 neural-network deep-learning caffe gradient-descent softmax 其他开发

如何在保存的 keras 序列模型中添加新类

我有 10 个类数据集，我得到了 85% 的准确率，在保存的模型上得到了相同的准确率.现在我想添加一个新类，如何将一个新类添加到保存的模型中.我尝试删除最后一层并进行训练，但模型过度拟合，并且在预测中每个图像都显示相同的结果(新添加的类). 这是我做的 model.pop()base_model_layers = 模型.输出pred = Dense(11, activation='soft ..

发布时间：2021-12-27 17:33:04 keras deep-learning conv-neural-network image-recognition 其他开发

在 Keras 中修改图层参数

我对更新 Keras 中现有的图层参数感兴趣(不是删除图层并插入一个新图层，而是修改现有参数). 我将举一个我正在编写的函数的例子: def add_filters(self, model):conv_indices = [i for i, layer in enumerate(model.layers) if 'convolution' in layer.get_config()['na ..

发布时间：2021-12-27 17:32:49 python neural-network keras deep-learning conv-neural-network Python

如何使用 sklearn.datasets.load_files 加载数据百分比

我使用 sklearn 加载了 8000 张图像.datasets.load_files 并通过来自 keras 的 resnet 获得瓶颈特征.然而，这项任务在 GPU 上需要几个小时，所以我想知道是否有办法告诉 load_files 加载 20% 之类的数据百分比. 我这样做是为了训练我自己的顶层(最后一个密集层)并将其附加到 resnet. def load_dataset(path ..

发布时间：2021-12-27 17:32:43 python-3.x numpy scikit-learn deep-learning keras Python

Tensorflow 对象检测 API 中的过拟合

我正在自定义数据集(即车牌数据集)上训练 tensorflow 对象检测 API 模型.我的目标是使用 tensorflow lite 将此模型部署到边缘设备，因此我无法使用任何 RCNN 系列模型.因为，我无法将任何 RCNN 系列对象检测模型转换为 tensorflow lite 模型(这是 tensorflow 对象检测 API 的限制).我正在使用 ssd_mobilenet_v2_coc ..

发布时间：2021-12-27 17:32:33 tensorflow deep-learning object-detection tensorboard object-detection-api 其他开发

从张量流模型检查点中提取权重值

我正在 tensorflow 中训练一个模型，我正在为我的模型做检查点.我在Checkpoints目录下，我有四个文件，检查点 model.cpkt-0.data-00000-of-00001 model.cpkt-0.index model.cpkt-0.meta 现在我想提取图中每一层的权重值，我该怎么做? 我试过了: 将 tensorflow 导入为 tfses ..

发布时间：2021-12-27 17:32:23 machine-learning tensorflow neural-network deep-learning conv-neural-network AI人工智能

使用 CNN 进行二元图像分类 - 选择“负"的最佳实践数据集?

比如说，我想训练一个 CNN 来检测图像是否是汽车. 选择“Not-Car"数据集的最佳实践或方法有哪些? 因为这个数据集可能是无限的(基本上不是汽车的任何东西) - 是否有关于数据集需要多大的指导方针?它们是否应该包含与汽车非常相似但又不是(飞机、船只等)的对象? 解决方案与所有监督式机器学习一样，训练集应该反映模型将要使用的真实分布.神经网络基本上是一个函数逼近器.您的实 ..

发布时间：2021-12-27 17:32:12 machine-learning neural-network computer-vision deep-learning conv-neural-network AI人工智能

我在哪里可以找到经过训练的模型(如 googleNet 的输出)与真实类别标签之间的标签映射?

大家，我是咖啡新手.目前，我尝试使用从模型动物园下载的经过训练的 GoogleNet 对一些图像进行分类.然而，网络的输出似乎是一个向量而不是真正的标签(如狗、猫).我在哪里可以找到经过训练的模型(如 googleNet 的输出)与其真实类别标签之间的标签映射?谢谢. 解决方案如果你从 git 得到 caffe 你应该在 data/ilsvrc12 文件夹中找到一个 shell 脚本 g ..

发布时间：2021-12-27 17:32:02 machine-learning neural-network deep-learning caffe AI人工智能

如何防止caffe中特定层的反向计算

我想在 caffe 中禁用某些卷积层中的反向计算，我该怎么做? 我使用了 propagate_down 设置，但是发现它适用于 fc 层而不是卷积层. 请帮忙~ 第一次更新:我在 test/pool_proj 层设置了 propagate_down:false.我不希望它向后(但其他层向后).但是从日志文件来看，该层仍然需要向后. 第二次更新:让我们表示一个深度学习模型，从输入 ..

发布时间：2021-12-27 17:31:56 machine-learning neural-network deep-learning caffe AI人工智能

deep-learning相关内容