cupy - IT屋-程序员软件开发技术分享社区

如果已使用GPU，则Cupy在多线程.pool中出现错误

我尝试在程序的两个部分使用CUPY，其中一个部分与池并行。我用一个简单的例子成功地重现了它： import cupy import numpy as np from multiprocessing import pool def f(x): return cupy.asnumpy(2*cupy.array(x)) input = np.array([1,2,3,4]) p ..

发布时间：2022-04-10 18:32:26 python-3.x python-multiprocessing cupy 其他开发

了解CUDA、Numba、Cupy等的扩展示例

几乎所有在线提供的Numba、CuPy等示例都是简单的数组添加，显示了从CPU单核/线程到GPU的加速比。而命令文档大多缺乏好的例子。此帖子旨在提供更全面的示例。提供的初始代码here。这是经典元胞自动机的一个简单模型。最初，它甚至不使用numpy，只使用纯python和Pyglet模块进行可视化。我的目标是将此代码扩展到特定问题(这将是非常大的问题)，但首先我认为最好已经针对GP ..

发布时间：2022-02-27 20:10:47 python gpu numba cupy Python

类型错误:不支持的类型 <type 'numpy.ndarray'>

我需要使用 cupy 而不是 numpy 在 GPU 中运行部分代码.所以，我只注释掉了这一行 # import numpy as np 并使用这一行而不是它 import cupy as np 完整代码: from imutils.video import VideoStream从 imutils.video 导入 FPS# 将 numpy 导入为 np将cupy导入为np导入参数解析导 ..

发布时间：2021-06-26 19:43:03 python-2.7 cupy 其他开发

类型错误:不支持的类型

我需要使用 cupy 而不是 numpy 在 GPU 中运行部分代码.所以，我只注释掉了这一行 # import numpy as np 并使用这一行而不是它 import cupy as np 完整代码: from imutils.video import VideoStream从 imutils.video 导入 FPS# 将 numpy 导入为 np将cupy导入为np导入参数解析导 ..

发布时间：2021-06-26 19:41:27 python-2.7 cupy 其他开发

我正在尝试使用 Numba 代码处理由 CuPy 逻辑生成的一些数据.但得到不同的错误.例如简化示例导入cupy为cp进口麻木从 numba 导入 void、int32、int64、float32、float64将 numpy 导入为 np@numba.jitdef numba_test(a, b, n, m):对于范围(n)中的我:对于范围内的 j (m):a[i, j] += b[i, j ..

发布时间：2021-06-10 19:06:56 python-3.x numba cupy 其他开发

使用Cupy从GPU上的另一个矩阵创建距离矩阵

我已经使用numpy编写了代码，该代码采用大小为(m x n)的数组...行(m)是由(n)个特征组成的单个观察结果...并且创建了大小为(m x m)的平方距离矩阵.该距离矩阵是给定观察值与所有其他观察值的距离.例如.第0行第9列是观测值0与观测值9之间的距离. 将numpy导入为np#将cupy作为np导入def l1_distance(arr):返回np.linalg.norm(arr，1 ..

发布时间：2021-05-13 18:42:57 python gpu cupy Python

为什么Python和CUDA不支持半精度复数浮点运算?

NumPY具有 complex64 对应于两个float32. 但是它也有float16，但是没有complex32. 为什么?我有涉及FFT的信号处理计算，我认为我可以使用complex32，但我不知道如何到达那里.特别是，我希望通过 cupy 在NVidia GPU上加快速度. 但是，float16似乎是复杂的整数，因为这可能还会提供提速的机会. 解决方案 CuPy存 ..

发布时间：2021-05-06 20:58:09 numpy fft cupy half-precision-float Python

Cupy释放统一内存

我在释放cupy中分配的内存时遇到问题.由于内存限制，我想使用统一内存.当我创建一个将分配给统一内存的变量并想要释放它时，它被标记为已释放，并且该池现在为空，可以再次使用，但是当我查看资源监视器时，内存仍然无法释放.当我创建另一个变量时，它也会添加到内存中(我认为可能会像文档中提到的那样重用标记为已占用的内存，但事实并非如此.) 这是一个小程序，可以通过增加睡眠来对其进行测试，以便能够查看资 ..

发布时间：2021-04-27 20:11:53 python memory-management cuda cupy Python

使用CuPy或NumPy有效地计算分区总和

我有一个要累加的长度很长的数组*，长度为 L (我们叫它 values )，还有一个长度相同的排序后的一维数组 L 包含用于对原始数组进行分区的 N 个整数–我们将此数组称为 labels . 我当前正在做的是这个(模块正在 cupy 或 numpy ): result = module.empty(N)对于范围(N)中的i:result [i] =值[labels == i] .sum ..

发布时间：2021-04-09 20:55:05 python arrays numpy cupy Python

是否可以在Google Colab上安装Cupy？

我正尝试在Google colab上使用GPU运行chainer。这需要安装cupy，但是由于无法在我的colab虚拟机中找到cuda环境，因此无法正确安装它。错误消息如下... 收集cupy 正在下载cupy-2.4.0.tar.gz（1.7MB） 100％|██████ ████████████████████████████| 1.7MB 740kB / s 命令pyth ..

发布时间：2020-10-13 00:44:44 cuda google-colaboratory chainer cupy 其他开发

安装带有cupy的pip软件包会使安装永无止境地循环

我试图制作一个带有cupy的pip包作为要求之一，但是我将cupy包含在要求中，pip安装最终以永无止境的循环结束.我正在尝试在已经安装了Cupy的Google Colab上安装该软件包，因此它应该只检查Cupy是否已经安装，而不要尝试再次安装. 我在github中做了一个最小的pip包，其中cupy是唯一的要求. https://github.com/Santosh-Gupta/Tr ..

发布时间：2020-05-27 23:31:33 python pip google-colaboratory cupy Python

尝试在内存映射模式下将cupy.load较大尺寸的.npy文件进行Cupy OutOfMemoryError时，但np.load可以正常工作

我正在尝试使用内存映射模式在Cupy中加载一些更大的.npy文件，但我一直遇到OutOfMemoryError. 我认为，由于它是在内存映射模式下打开的，因此此操作不应占用太多内存，因为内存映射实际上并未将整个数组加载到内存中. 我可以用np.load很好地加载这些文件，这似乎只发生在cupy.load中.我的环境是带有Cosla K80 GPU的Google Colab.它具有约12 ..

发布时间：2020-05-18 22:08:13 python numpy google-colaboratory cupy Python

如何使用CUDA固定的“零复制"功能用于内存映射文件的内存?

目标/问题在Python中，我正在寻找一种从内存映射文件到GPU读取/写入数据的快速方法. 在先前的SO溢出帖子中[在提到该问题的地方，可以使用CUDA固定的“零复制"存储器.此外，这种方法似乎是由该人开发的[ cud-零拷贝内存，内存映射文件]尽管人当时在用C ++工作. 我以前的尝试是在Cupy中进行的，但是我可以接受任何cuda方法. 到目前为止我尝试过的一切 ..

发布时间：2020-05-08 21:57:49 numpy memory-management cuda chainer cupy Python

cupy相关内容