intel-mkl相关内容

用C++将COO格式转换为CSR格式

我有一个COO格式的矩阵。更具体地说,有三个矩阵row_index、column_index、value。您能帮我用C语言以一种高效且计算不昂贵的方式将该矩阵格式转换为CSRformat吗?是否有用于此目的的库? 示例: COO格式: row_index col_index value 1 1 1 ..
发布时间:2022-08-12 18:48:13 其他开发

为什么MatLab&;的mlDivide比dgels好得多?

求解Ax = b。真正的双倍。A是带有M>2的超定Mx2。b是Mx1。我对mldivide运行了大量数据,结果非常好。我用MKLLAPACKE_dgels编写了一个Mex例程,但它远没有那么好。结果有大量的噪音,潜在的信号几乎不在那里。我首先对照MKL示例结果检查了例程。我已经搜索了mldivide文档(流程图)和SO问题。我所发现的就是MatLab对超定矩形使用QR分解。 接下来我应该尝试 ..
发布时间:2022-07-15 13:53:05 其他开发

告诉GCC不要链接libgomp,这样它就会链接libiop5

我需要找出一个可以提供给GCC的编译器/链接器指令,以便在指定-fopenmp时它不会自动链接libgomp。 原因是我试图针对Intel的MKL BLAS进行构建。MKL需要添加单独的英特尔库来处理多线程(例如,libmkl_intel_thread或libmkl_gnu_thread)。然而,并不是所有操作系统(包括我的操作系统)上都有用于链接MKL和libgomp的库。这迫使我链接li ..
发布时间:2022-03-17 09:37:09 其他开发

直接在 Scipy 稀疏矩阵上使用 Intel mkl 库以更少的内存计算 A 点 A.T

我想从 python 调用 mkl.mkl_scsrmultcsr.目标是计算 压缩稀疏行 格式.稀疏矩阵C是A与A的转置的矩阵乘积,其中A也是csr格式的稀疏矩阵.当用 scipy 计算 C = A dot (AT) 时,scipy 似乎 (?)矩阵).所以,我想尝试直接使用 mkl c 函数来减少内存使用. 这里适用于另一个 mkl 函数的答案.在那个答案中,mkl 函数快了 4 倍. ..
发布时间:2021-12-31 11:53:36 Python

向 pip 提供 NumPy site.cfg 参数

我使用的是针对英特尔 Math Kernel 库构建的 NumPy.我使用 virtualenv,通常使用 pip 来安装包. 但是,为了让 NumPy 找到 MKL 库,需要在编译之前在 NumPy 源目录中创建一个 site.cfg 文件,然后手动构建和安装.我可以编写整个过程的脚本,但我希望有一个更简单的解决方案. 我有一个标准的 site.cfg 文件,可在版本控制下用于此目的 ..
发布时间:2021-12-30 19:41:58 Python

使用英特尔 MKL 的 3D 卷积

我正在尝试使用英特尔 MKL 计算 3D 阵列的 3D 卷积.有人可以给我一些提示,我该怎么做?是否可以使用 MKL 实现?提前致谢. 解决方案 Intel 有 一个例子在他们的 3D FFT 页面上,这应该有助于在频率空间中通过乘法进行卷积.抱歉,我没有完整的解决方案: 三维实数FFT(C接口) #include "mkl_dfti.h"浮动 x[32][100][19];浮动 ..
发布时间:2021-11-25 03:39:23 C#

增加主程序的堆栈大小或为递归代码块创建一个具有更大堆栈大小的新线程?

我有一个后续问题什么是BackgroundWorker DoWork 线程的堆栈大小?有办法改吗? 我是否应该使用以下构建后事件增加主程序的堆栈大小: "$(DevEnvDir)..\..\VC\bin\editbin.exe"/STACK:8388608 "$(TargetPath)" 或者我应该将我的递归代码块封装在一个具有更大堆栈大小的新线程中吗? Thread thread = ..
发布时间:2021-11-24 10:17:35 C#/.NET

增加主程序的堆栈大小或为递归代码块创建一个具有更大堆栈大小的新线程?

我有一个后续问题什么是BackgroundWorker DoWork 线程的堆栈大小?有办法改吗? 我是否应该使用以下构建后事件增加主程序的堆栈大小: "$(DevEnvDir)..\..\VC\bin\editbin.exe"/STACK:8388608 "$(TargetPath)" 或者我应该将我的递归代码块封装在一个具有更大堆栈大小的新线程中吗? Thread thread = ..
发布时间:2021-11-24 10:16:22 C#/.NET

检测是否在 Visual Studio 项目的属性中启用了英特尔 MKL

我正在开展一个项目,其中英特尔 MKL 很不错,但并非在所有目标平台上都可用,因此我必须检查其是否存在以相应地进行操作. 我已在我的 Visual Studio 项目的属性中启用了 Intel Performance Libraries,如 使用 Microsoft* Visual C++* 编译和链接英特尔® Math Kernel Library 和在 英特尔® 数学内核库(英特尔® M ..
发布时间:2021-09-18 20:15:05 C/C++开发

对于小数据集,为什么使用cula(dgesv)求解线性方程组比mkl(dgesv)慢

我已经编写了CUDA C和C程序,以使用CULA例程dgesv和MKL例程dgesv求解矩阵方程Ax = b.对于较小的数据集,CPU程序似乎比GPU程序快.但是随着数据集增加到500个以上,GPU克服了CPU的困扰.我正在使用配有i3 CPU和Geforce 525M GPU的戴尔笔记本电脑.对于GPU最初的缓慢性能的最佳解释是什么? 我编写了另一个程序,该程序接受两个向量,将它们相乘并相 ..
发布时间:2021-04-27 20:13:11 其他开发

将Ipopt与Intel MKL关联

我正在尝试将Ipopt与Intel MKL(说明). 英特尔的链接顾问建议: 链接行: -Wl,-start-group $ {MKLROOT}/lib/intel64/libmkl_intel_ilp64.a $ {MKLROOT}/lib/intel64/libmkl_core.a $ {MKLROOT}/lib/intel64/libmkl_intel_thread.a-Wl ..
发布时间:2021-04-19 19:47:14 C/C++开发

MKL是否针对*主要订单优化cblas?

我正在使用 mkl cblas_dgemm ,目前将其与 CblasRowMajor , CblasNoTrans , CblasNotrans ,用于我的矩阵. 我知道 c 是行主要语言,而 dgemm 是列主要算法.我有兴趣知道,如果我要链接到 mkl ,切换矩阵的顺序是否会对 cblas_dgemm 算法产生任何影响. mkl 是否足够聪明,可以在幕后做一些事情来优化矩阵乘法呢?如果不 ..
发布时间:2021-04-02 20:32:41 其他开发

Zheev特征值和向量不正确

我在Fortran科学代码中使用LAPACK zheev例程来计算不太大(可能永远不会超过1000大小)的矩阵的特征值和向量. 由于此步骤发生在计算的开始,所以我必须获得很高的精度,以避免重要的错误传播.问题在于,在我的测试用例中(仅使用12x12矩阵),计算精度仅为1e-9左右,这根本不够. 我与numpy.linalg.eigh进行了比较,后者给出了可笑的更好结果,我想知道如何使用 ..
发布时间:2020-11-10 06:54:34 其他开发