deep-learning相关内容

如何连接词向量形成句子向量

我在一些文章(Tomas Mikolov...)中了解到,形成句子向量的更好方法是连接词向量. 但是由于我的数学很笨拙,我仍然不确定细节. 例如 假设词向量的维数为m;并且一个句子有 n 个单词. 连接操作的正确结果是什么? 它是 1 x m*n 的行向量吗?还是一个 m x n 的矩阵? 解决方案 组合嵌入向量至少有三种常用的方法;(a) 求和,(b) 求和 ..
发布时间:2022-01-02 18:00:48 AI人工智能

用于 Caffe 的 Python 或 Matlab?

我将致力于在 Caffe 中实现 DQN 和来自 Google DeepMind 的最新扩展. 为此,我将编写一个模拟器(代替 Atari 模拟器)来为代理创建培训体验. 我的问题是:Caffe 的 Matlab 或 Python 接口中哪个最成熟且运行良好? 为此任务在 Python 和 Matlab 之间进行选择还有其他考虑吗? 应该注意的是,我在 Python 开发方面比 ..
发布时间:2021-12-31 17:11:07 Python

Caffe:如果两层反向传播梯度到同一个底部 blob 会发生什么?

我想知道如果我有一个生成底部 blob 的层,该层会被两个后续层进一步消耗,这两个层都会在反向传播阶段生成一些梯度来填充 bottom.diff.两个梯度会加起来形成最终的梯度吗?或者,只有其中一个可以存活?在我的理解中,Caffe 层需要在用一些计算的梯度填充之前将 bottom.diff 设置为全零,对吗?memset 会清除其他层已经计算的梯度吗?谢谢! 解决方案 使用多个损失层并不 ..

为什么我的模型预测相同的标签?

我正在训练一个小型网络,训练似乎进行得很顺利,val loss 减少,我达到了 80 左右的验证准确率,一旦没有更多改进,它实际上停止了训练(耐心 = 10).它训练了 40 个 epoch.然而,它一直只为每个测试图像预测一个类!我尝试随机初始化 conv 层,我添加了正则化器,我从 Adam 切换到 SGD,我添加了 clipvalue,我添加了 dropouts.我也切换到了 softmax ..

Caffe 输出层数精度

我修改了 Caffe MNIST 示例 以对 3 类图片.我注意到的一件事是,如果我将输出层的数量指定为 3,那么我的测试准确度会急剧下降——下降到 40% 的低范围.但是,如果我 +1 并且有 4 个输出层,则结果在 95% 范围内. 我在我的数据集中添加了一个额外的图像类(所以 4 个类)并注意到同样的事情 - 如果输出层的数量与类的数量相同,那么结果是可怕的,如果它是相同的 +1,然后效果 ..

Keras 自定义指标迭代

我对 Keras 还很陌生,我正在尝试定义自己的指标.它计算一致性指数,这是回归问题的度量. def cindex_score(y_true, y_pred):总和 = 0对 = 0对于范围内的 i(1, len(y_true)):对于范围内的 j (0, i):如果我不是 j:如果(y_true[i] > y_true[j]):对 +=1sum += 1* (y_pred[i] > y_pre ..
发布时间:2021-12-31 17:08:22 Python

AttributeError: 在使用自定义生成器的 Keras 模型上调用 fit 时,'tuple' 对象没有属性 'rank'

我想构建一个具有两个输入的神经网络:用于图像数据和数字数据.所以我为此编写了自定义数据生成器.train 和 validation 数据帧包含 11 列: image_name — 图像的路径; 9 个数字特征; target — 项目的类(最后一列). 自定义生成器的代码(基于这个答案): target_size = (224, 224)批量大小 = 1train_datage ..
发布时间:2021-12-31 17:08:09 Python

Keras VGG16 微调

keras==2.0.0 和 theano 后端. 注意:我使用了来自 gist 和 applications.VGG16 实用程序的示例,但在尝试连接模型时遇到问题,我对 keras 函数式 API.所以我在这里提供的这个解决方案是最“成功"的一个,即它只在拟合阶段失败. 更新 #1 好的,这是关于我正在尝试做的事情的一个小解释.首先,我从 VGG16 生成瓶颈特征如下: d ..
发布时间:2021-12-31 17:07:45 Python

MNIST Pytorch 中的验证错误意外增加

我对整个领域有点陌生,因此决定研究 MNIST 数据集.我几乎改编了 https://github.com/的整个代码pytorch/examples/blob/master/mnist/main.py,只有一个重大变化:数据加载.我不想在 Torchvision 中使用预加载的数据集.所以我使用了 CSV 中的 MNIST. 我通过继承 Dataset 并创建一个新的数据加载器从 CSV ..
发布时间:2021-12-27 17:33:20 Python

softmax 版本的triplet loss 的梯度计算

我一直在尝试在 中描述的Caffe中实现三元组损失的softmax版本Hoffer 和 Ailon,使用三元组网络的深度度量学习,ICLR 2015. 我已经尝试过这个,但我发现很难计算梯度,因为指数中的 L2 不是平方. 有人可以帮我吗? 解决方案 使用现有的 caffe 层实现 L2 规范可以为您省去所有麻烦. 这是在 caffe 中为“bottom"s x1 和 ..

如何在保存的 keras 序列模型中添加新类

我有 10 个类数据集,我得到了 85% 的准确率,在保存的模型上得到了相同的准确率.现在我想添加一个新类,如何将一个新类添加到保存的模型中.我尝试删除最后一层并进行训练,但模型过度拟合,并且在预测中每个图像都显示相同的结果(新添加的类). 这是我做的 model.pop()base_model_layers = 模型.输出pred = Dense(11, activation='soft ..

如何使用 sklearn.datasets.load_files 加载数据百分比

我使用 sklearn 加载了 8000 张图像.datasets.load_files 并通过来自 keras 的 resnet 获得瓶颈特征.然而,这项任务在 GPU 上需要几个小时,所以我想知道是否有办法告诉 load_files 加载 20% 之类的数据百分比. 我这样做是为了训练我自己的顶层(最后一个密集层)并将其附加到 resnet. def load_dataset(path ..
发布时间:2021-12-27 17:32:43 Python

Tensorflow 对象检测 API 中的过拟合

我正在自定义数据集(即车牌数据集)上训练 tensorflow 对象检测 API 模型.我的目标是使用 tensorflow lite 将此模型部署到边缘设备,因此我无法使用任何 RCNN 系列模型.因为,我无法将任何 RCNN 系列对象检测模型转换为 tensorflow lite 模型(这是 tensorflow 对象检测 API 的限制).我正在使用 ssd_mobilenet_v2_coc ..

使用 CNN 进行二元图像分类 - 选择“负"的最佳实践数据集?

比如说,我想训练一个 CNN 来检测图像是否是汽车. 选择“Not-Car"数据集的最佳实践或方法有哪些? 因为这个数据集可能是无限的(基本上不是汽车的任何东西) - 是否有关于数据集需要多大的指导方针?它们是否应该包含与汽车非常相似但又不是(飞机、船只等)的对象? 解决方案 与所有监督式机器学习一样,训练集应该反映模型将要使用的真实分布.神经网络基本上是一个函数逼近器.您的实 ..

我在哪里可以找到经过训练的模型(如 googleNet 的输出)与真实类别标签之间的标签映射?

大家,我是咖啡新手.目前,我尝试使用从模型动物园下载的经过训练的 GoogleNet 对一些图像进行分类.然而,网络的输出似乎是一个向量而不是真正的标签(如狗、猫).我在哪里可以找到经过训练的模型(如 googleNet 的输出)与其真实类别标签之间的标签映射?谢谢. 解决方案 如果你从 git 得到 caffe 你应该在 data/ilsvrc12 文件夹中找到一个 shell 脚本 g ..

如何防止caffe中特定层的反向计算

我想在 caffe 中禁用某些卷积层中的反向计算,我该怎么做? 我使用了 propagate_down 设置,但是发现它适用于 fc 层而不是卷积层. 请帮忙~ 第一次更新:我在 test/pool_proj 层设置了 propagate_down:false.我不希望它向后(但其他层向后).但是从日志文件来看,该层仍然需要向后. 第二次更新:让我们表示一个深度学习模型,从输入 ..