cupy相关内容

了解CUDA、Numba、Cupy等的扩展示例

几乎所有在线提供的Numba、CuPy等示例都是简单的数组添加,显示了从CPU单核/线程到GPU的加速比。而命令文档大多缺乏好的例子。此帖子旨在提供更全面的示例。 提供的初始代码here。这是经典元胞自动机的一个简单模型。最初,它甚至不使用numpy,只使用纯python和Pyglet模块进行可视化。 我的目标是将此代码扩展到特定问题(这将是非常大的问题),但首先我认为最好已经针对GP ..
发布时间:2022-02-27 20:10:47 Python

类型错误:不支持的类型

我需要使用 cupy 而不是 numpy 在 GPU 中运行部分代码.所以,我只注释掉了这一行 # import numpy as np 并使用这一行而不是它 import cupy as np 完整代码: from imutils.video import VideoStream从 imutils.video 导入 FPS# 将 numpy 导入为 np将cupy导入为np导入参数解析导 ..
发布时间:2021-06-26 19:41:27 其他开发

CuPy 数据上的“无法确定 Numba 类型"错误

我正在尝试使用 Numba 代码处理由 CuPy 逻辑生成的一些数据.但得到不同的错误.例如简化示例 导入cupy为cp进口麻木从 numba 导入 void、int32、int64、float32、float64将 numpy 导入为 np@numba.jitdef numba_test(a, b, n, m):对于范围(n)中的我:对于范围内的 j (m):a[i, j] += b[i, j ..
发布时间:2021-06-10 19:06:56 其他开发

使用Cupy从GPU上的另一个矩阵创建距离矩阵

我已经使用numpy编写了代码,该代码采用大小为(m x n)的数组...行(m)是由(n)个特征组成的单个观察结果...并且创建了大小为(m x m)的平方距离矩阵.该距离矩阵是给定观察值与所有其他观察值的距离.例如.第0行第9列是观测值0与观测值9之间的距离. 将numpy导入为np#将cupy作为np导入def l1_distance(arr):返回np.linalg.norm(arr,1 ..
发布时间:2021-05-13 18:42:57 Python

为什么Python和CUDA不支持半精度复数浮点运算?

NumPY具有 complex64 对应于两个float32. 但是它也有float16,但是没有complex32. 为什么?我有涉及FFT的信号处理计算,我认为我可以使用complex32,但我不知道如何到达那里.特别是,我希望通过 cupy 在NVidia GPU上加快速度. 但是,float16似乎是复杂的整数,因为这可能还会提供提速的机会. 解决方案 CuPy存 ..
发布时间:2021-05-06 20:58:09 Python

Cupy释放统一内存

我在释放cupy中分配的内存时遇到问题.由于内存限制,我想使用统一内存.当我创建一个将分配给统一内存的变量并想要释放它时,它被标记为已释放,并且该池现在为空,可以再次使用,但是当我查看资源监视器时,内存仍然无法释放.当我创建另一个变量时,它也会添加到内存中(我认为可能会像文档中提到的那样重用标记为已占用的内存,但事实并非如此.) 这是一个小程序,可以通过增加睡眠来对其进行测试,以便能够查看资 ..
发布时间:2021-04-27 20:11:53 Python

使用CuPy或NumPy有效地计算分区总和

我有一个要累加的长度很长的数组*,长度为 L (我们叫它 values ),还有一个长度相同的排序后的一维数组 L 包含用于对原始数组进行分区的 N 个整数–我们将此数组称为 labels . 我当前正在做的是这个(模块正在 cupy 或 numpy ): result = module.empty(N)对于范围(N)中的i:result [i] =值[labels == i] .sum ..
发布时间:2021-04-09 20:55:05 Python

是否可以在Google Colab上安装Cupy?

我正尝试在Google colab上使用GPU运行chainer。这需要安装cupy,但是由于无法在我的colab虚拟机中找到cuda环境,因此无法正确安装它。 错误消息如下... 收集cupy 正在下载cupy-2.4.0.tar.gz(1.7MB) 100%|██████ ████████████████████████████| 1.7MB 740kB / s 命令pyth ..
发布时间:2020-10-13 00:44:44 其他开发

安装带有cupy的pip软件包会使安装永无止境地循环

我试图制作一个带有cupy的pip包作为要求之一,但是我将cupy包含在要求中,pip安装最终以永无止境的循环结束.我正在尝试在已经安装了Cupy的Google Colab上安装该软件包,因此它应该只检查Cupy是否已经安装,而不要尝试再次安装. 我在github中做了一个最小的pip包,其中cupy是唯一的要求. https://github.com/Santosh-Gupta/Tr ..
发布时间:2020-05-27 23:31:33 Python

尝试在内存映射模式下将cupy.load较大尺寸的.npy文件进行Cupy OutOfMemoryError时,但np.load可以正常工作

我正在尝试使用内存映射模式在Cupy中加载一些更大的.npy文件,但我一直遇到OutOfMemoryError. 我认为,由于它是在内存映射模式下打开的,因此此操作不应占用太多内存,因为内存映射实际上并未将整个数组加载到内存中. 我可以用np.load很好地加载这些文件,这似乎只发生在cupy.load中.我的环境是带有Cosla K80 GPU的Google Colab.它具有约12 ..
发布时间:2020-05-18 22:08:13 Python

如何使用CUDA固定的“零复制"功能用于内存映射文件的内存?

目标/问题 在Python中,我正在寻找一种从内存映射文件到GPU读取/写入数据的快速方法. 在先前的SO溢出帖子中[在提到该问题的地方,可以使用CUDA固定的“零复制"存储器.此外,这种方法似乎是由该人开发的[ cud-零拷贝内存,内存映射文件]尽管人当时在用C ++工作. 我以前的尝试是在Cupy中进行的,但是我可以接受任何cuda方法. 到目前为止我尝试过的一切 ..
发布时间:2020-05-08 21:57:49 Python