tensorflow-gpu相关内容

如何为 TensorFlow Estimators 充分利用 GPU?

我的深度学习模型使用的是 Tensorflow(CPU 版本).具体使用 DNNRegressor Estimator 进行训练,使用给定的参数集(网络结构、隐藏层、alpha 等)虽然我能够减少损失,但模型需要非常长的学习时间(大约 3 天.)和时间每 100 步需要 9 秒. 我看到了这篇文章:-https://medium.com/towards-data-科学/如何训练张量流模型-7 ..
发布时间:2021-12-31 17:01:21 Python

简单的 TensorFlow 示例将模型的一个副本加载到每个可用的 GPU 上

我正在考虑从不同的生产机器学习框架移植到 TensorFlow.在我们当前用于训练和推理的系统中,我们将模型的副本加载到与机器上一样多的 GPU 上. 我想暂时保留这种负载平衡方式.在哪里可以找到将 TF 模型的一个副本加载到机器上可用的每个 GPU 上的简单示例? 解决方案 以下是 https://github.com/rafaljozefowicz/lm/blob/master/ ..
发布时间:2021-09-05 19:55:45 其他开发

几个时期后的 tensorflow-GPU OOM 问题

我使用 tensorflow 在 Nvidia Geforce 1060(6G 内存)上训练 CNN,但我遇到了 OOM 异常. 前两个时期的训练过程很好,但在第三个时期出现了 OOM 异常. ============================2017-10-27 11:47:30.219130: W tensorflow/core/common_runtime/bfc_allo ..
发布时间:2021-09-05 19:43:38 其他开发

Tensorflow GPU 停止工作

重现问题 几天前我运行了 tensorflow,但它停止工作了.使用教程代码对其进行测试后,mnist_softmax 和 mnist_deep 失败.Tensorflow 成功地运行了简单的 helloworld 内容. 我的尝试 与 delton137 一样,我尝试设置 allow_growth 为 True 或 per_process_gpu_memory_fraction ..
发布时间:2021-09-05 19:35:39 其他开发

分布式 Tensorflow:检查失败:size>=0

我使用的是 keras 2.0.6.tensorflow 的版本是 1.3.0. 我的代码可以在 theano 后端运行,但在 tensorflow 后端运行失败: F tensorflow/core/framework/tensor_shape.cc:241] 检查失败:大小 >= 0 (-14428307456 vs. 0) 我想知道是否有人能想到可能导致这种情况的任何可能原 ..
发布时间:2021-09-05 19:29:22 其他开发

TensorFlow:ValueError: 'images' 不包含任何形状

我使用 TensorFlow 函数 tf.image.resize_images 来调整我的图像大小,但我在代码中遇到了这个错误:ValueError: 'images' 不包含任何形状.完整代码如下: # -*- 编码:utf-8 -*-将张量流导入为 tf文件 = ["./1.jpg"]f = tf.train.string_input_producer(文件)阅读器 = tf.WholeF ..
发布时间:2021-09-05 19:26:04 其他开发

有没有办法在 GPU 上使用 tensorflow map_fn?

我有一个形状为 [a,n] 的张量 A,我需要使用另一个形状为 B 的张量执行操作 my_op[b,n] 使得结果张量 C 的形状为 [a,b]. 换句话说:对于 A (A[0], A1,...A[n]) 我需要在 Beach 子张量执行元素明智的操作/强>. 因此生成的张量将包含以下内容: [ [ A[0] op B[0] , A[0] op B[1], ... , A[0] op ..
发布时间:2021-09-05 18:55:21 Python

如何使用 Tensorflow 的数据集 API 将数据移动到多个 GPU 塔

我们正在 Tensorflow 上运行多 GPU 作业,并评估从基于队列的模型(使用 string_input_producer 接口)到新的 Tensorflow Dataset API 的迁移.后者似乎提供了一种更简单的方法来同时在训练和验证之间切换. 下面的一段代码展示了我们是如何做到这一点的. train_dataset, train_iterator = get_dataset ..
发布时间:2021-09-05 18:43:37 其他开发

如何在tensorflow中设置特定的gpu?

我想指定 gpu 来运行我的进程.我设置如下: 将 tensorflow 导入为 tf使用 tf.device('/gpu:0'):a = tf.constant(3.0)使用 tf.Session() 作为 sess:为真:打印 sess.run(a) 但是它仍然在我的两个 gpu 中分配内存. |0 7479 C 蟒蛇 5437MiB|1 7479 C 蟒蛇 5437MiB 解决方案 ..
发布时间:2021-09-05 18:40:56 其他开发

张量流中的索引比收集慢

我正在尝试索引张量以从一维张量中获取切片或单个元素.我发现使用 numpy 索引[:] 和 slice vs tf.gather 的方式时有显着的性能差异(几乎 30-40%). 我还观察到 tf.gather 在用于标量(循环未堆叠张量)时具有显着的开销,而不是 tensor .这是一个已知问题吗? 示例代码(效率低下): 用于 graph.nodes() 中的 node_idx ..

仅使用1-5%Tensorflow-gpu和Keras的GPU

我刚刚为gpu安装了tensorflow,并为我的CNN使用了keras.在训练期间,我的GPU仅使用了5%,但是在训练期间使用了6 GB的vram中的5.有时会出现故障,在控制台上打印0.000000e + 00,gpu降到100%,但几秒钟后,训练速度会降低到5%.我的GPU是Zotac gtx 1060 mini,我使用的是Ryzen 5 1600x. Epoch 1/25 121/ ..
发布时间:2021-02-14 20:32:32 Python