intel-mkl - IT屋-程序员软件开发技术分享社区

用C++将COO格式转换为CSR格式

我有一个COO格式的矩阵。更具体地说，有三个矩阵row_index、column_index、value。您能帮我用C语言以一种高效且计算不昂贵的方式将该矩阵格式转换为CSRformat吗？是否有用于此目的的库？示例： COO格式： row_index col_index value 1 1 1 ..

发布时间：2022-08-12 18:48:13 c sparse-matrix intel-mkl 其他开发

为什么MatLab&；的mlDivide比dgels好得多？

求解Ax = b。真正的双倍。A是带有M>2的超定Mx2。b是Mx1。我对mldivide运行了大量数据，结果非常好。我用MKLLAPACKE_dgels编写了一个Mex例程，但它远没有那么好。结果有大量的噪音，潜在的信号几乎不在那里。我首先对照MKL示例结果检查了例程。我已经搜索了mldivide文档(流程图)和SO问题。我所发现的就是MatLab对超定矩形使用QR分解。接下来我应该尝试 ..

发布时间：2022-07-15 13:53:05 matlab linear-algebra lapack intel-mkl 其他开发

告诉GCC不要链接libgomp，这样它就会链接libiop5

我需要找出一个可以提供给GCC的编译器/链接器指令，以便在指定-fopenmp时它不会自动链接libgomp。原因是我试图针对Intel的MKL BLAS进行构建。MKL需要添加单独的英特尔库来处理多线程(例如，libmkl_intel_thread或libmkl_gnu_thread)。然而，并不是所有操作系统(包括我的操作系统)上都有用于链接MKL和libgomp的库。这迫使我链接li ..

发布时间：2022-03-17 09:37:09 gcc openmp intel-mkl libgomp 其他开发

为什么在我使用 MKL 时 Tensorflow 会警告 AVX2?

我正在使用支持 MKL 的 Tensorflow 的 Anaconda 发行版. 从 tensorflow.python.framework 导入 test_utiltest_util.IsMklEnabled() 此代码打印 True.但是，当我编译我的 Keras 模型时，我仍然得到您的 CPU 支持此 TensorFlow 二进制文件不支持的指令编译使用:AVX AVX2 ..

发布时间：2022-01-10 21:38:46 tensorflow keras anaconda intel-mkl avx2 其他开发

如果参数大小大于 8192，为什么 numpy.sin 会返回不同的结果?

我发现当参数大小为 8192 时，numpy.sin 的行为不同.不同之处在于性能和返回的值.有人能解释一下这种效果吗? 例如，让我们计算 sin(pi/4): x = np.pi*0.25对于范围内的 n (8191, 8195):xx = np.repeat(x, n)%timeit np.sin(xx)打印(n，np.sin(xx)[0]) 64.7 µs ..

发布时间：2022-01-10 21:34:03 python numpy anaconda intel-mkl Python

直接在 Scipy 稀疏矩阵上使用 Intel mkl 库以更少的内存计算 A 点 A.T

我想从 python 调用 mkl.mkl_scsrmultcsr.目标是计算压缩稀疏行格式.稀疏矩阵C是A与A的转置的矩阵乘积，其中A也是csr格式的稀疏矩阵.当用 scipy 计算 C = A dot (AT) 时，scipy 似乎 (?)矩阵).所以，我想尝试直接使用 mkl c 函数来减少内存使用. 这里适用于另一个 mkl 函数的答案.在那个答案中，mkl 函数快了 4 倍. ..

发布时间：2021-12-31 11:53:36 python scipy ctypes sparse-matrix intel-mkl Python

向 pip 提供 NumPy site.cfg 参数

我使用的是针对英特尔 Math Kernel 库构建的 NumPy.我使用 virtualenv，通常使用 pip 来安装包. 但是，为了让 NumPy 找到 MKL 库，需要在编译之前在 NumPy 源目录中创建一个 site.cfg 文件，然后手动构建和安装.我可以编写整个过程的脚本，但我希望有一个更简单的解决方案. 我有一个标准的 site.cfg 文件，可在版本控制下用于此目的 ..

发布时间：2021-12-30 19:41:58 python numpy pip intel-mkl Python

Pyinstaller numpy“Intel MKL 致命错误:无法加载 mkl_intel_thread.dll"

我是 Python 应用程序的新手.我正在尝试使用 pyinstaller 构建我的 python GUI 应用程序.我的应用程序依赖于以下软件包:PyQt4、numpy、pyqtgraph、h5py.我正在使用 WinPython-32bit-3.4.4.1. 我使用以下命令构建应用程序: pyinstaller --hidden-import=h5py.defs --hidden-im ..

发布时间：2021-12-25 16:07:45 python numpy dll pyinstaller intel-mkl Python

使用英特尔 MKL 的 3D 卷积

我正在尝试使用英特尔 MKL 计算 3D 阵列的 3D 卷积.有人可以给我一些提示，我该怎么做?是否可以使用 MKL 实现?提前致谢. 解决方案 Intel 有一个例子在他们的 3D FFT 页面上，这应该有助于在频率空间中通过乘法进行卷积.抱歉，我没有完整的解决方案: 三维实数FFT(C接口) #include "mkl_dfti.h"浮动 x[32][100][19];浮动 ..

发布时间：2021-11-25 03:39:23 c 3d fft convolution intel-mkl C#

增加主程序的堆栈大小或为递归代码块创建一个具有更大堆栈大小的新线程?

我有一个后续问题什么是BackgroundWorker DoWork 线程的堆栈大小?有办法改吗? 我是否应该使用以下构建后事件增加主程序的堆栈大小: "$(DevEnvDir)..\..\VC\bin\editbin.exe"/STACK:8388608 "$(TargetPath)" 或者我应该将我的递归代码块封装在一个具有更大堆栈大小的新线程中吗? Thread thread = ..

发布时间：2021-11-24 10:17:35 c# .net-4.5 intel-mkl stack-size C#/.NET

增加主程序的堆栈大小或为递归代码块创建一个具有更大堆栈大小的新线程?

我有一个后续问题什么是BackgroundWorker DoWork 线程的堆栈大小?有办法改吗? 我是否应该使用以下构建后事件增加主程序的堆栈大小: "$(DevEnvDir)..\..\VC\bin\editbin.exe"/STACK:8388608 "$(TargetPath)" 或者我应该将我的递归代码块封装在一个具有更大堆栈大小的新线程中吗? Thread thread = ..

发布时间：2021-11-24 10:16:22 c# .net-4.5 intel-mkl stack-size C#/.NET

检测是否在 Visual Studio 项目的属性中启用了英特尔 MKL

我正在开展一个项目，其中英特尔 MKL 很不错，但并非在所有目标平台上都可用，因此我必须检查其是否存在以相应地进行操作. 我已在我的 Visual Studio 项目的属性中启用了 Intel Performance Libraries，如使用 Microsoft* Visual C++* 编译和链接英特尔® Math Kernel Library 和在英特尔® 数学内核库(英特尔® M ..

发布时间：2021-09-18 20:15:05 c++ visual-studio intel-mkl C/C++开发

我正在将一个带有大量系数数组运算的 Matlab 算法移植到 C++，它看起来像这个例子，但通常要复杂得多: Eigen::Arraytx2(12);tx2＜＜1、2、3、4、5、6；Eigen::ArrayTX1(12);tx1＜＜7、8、9、10、11、12；Eigen::Arrayx = (tx1 + tx2)/2; 结果证明 C++ 代码明显比 Matlab 慢(大约 20%).因此， ..

发布时间：2021-06-15 19:44:38 c++ performance intel-mkl eigen3 C/C++开发

OMP 并行区域内英特尔 MKL 函数的线程数

我在 C 中有一个多线程代码，使用 OpenMP 和英特尔 MKL 函数.我有以下代码: omp_set_num_threads(nth);#pragma omp parallel for private(l,s) schedule(static)for(l=0;l 我想在这个 pramga 中使用多核处理器的所有内核(nth 的值).但我希望每个核心独立计算一个 mkl_ddot 函数(每 ..

发布时间：2021-06-04 20:04:41 c multithreading intel-mkl openmp 其他开发

英特尔MKL和JNI:如何添加ld从中搜索符号的共享库?

我正在尝试使用自己构建的C ++共享库( libmine.so )，并使用Java通过JNI使用英特尔的MKL库. 我还创建了 libminejni.so ，并从Java代码中加载了它，如下所示: System.loadLibrary("minejni") 但是，它未能加载MKL库之一( libmkl_avx2.so ) /libmkl_avx2.so: ..

发布时间：2021-05-19 18:46:08 java c++ java-native-interface ld intel-mkl Java开发

对于小数据集，为什么使用cula(dgesv)求解线性方程组比mkl(dgesv)慢

我已经编写了CUDA C和C程序，以使用CULA例程dgesv和MKL例程dgesv求解矩阵方程Ax = b.对于较小的数据集，CPU程序似乎比GPU程序快.但是随着数据集增加到500个以上，GPU克服了CPU的困扰.我正在使用配有i3 CPU和Geforce 525M GPU的戴尔笔记本电脑.对于GPU最初的缓慢性能的最佳解释是什么? 我编写了另一个程序，该程序接受两个向量，将它们相乘并相 ..

发布时间：2021-04-27 20:13:11 cuda gpgpu intel-mkl cula 其他开发

将Ipopt与Intel MKL关联

我正在尝试将Ipopt与Intel MKL(说明). 英特尔的链接顾问建议: 链接行: -Wl，-start-group $ {MKLROOT}/lib/intel64/libmkl_intel_ilp64.a $ {MKLROOT}/lib/intel64/libmkl_core.a $ {MKLROOT}/lib/intel64/libmkl_intel_thread.a-Wl ..

发布时间：2021-04-19 19:47:14 c++ lapack blas intel-mkl ipopt C/C++开发

MKL是否针对*主要订单优化cblas?

我正在使用 mkl cblas_dgemm ，目前将其与 CblasRowMajor ， CblasNoTrans ， CblasNotrans ，用于我的矩阵. 我知道 c 是行主要语言，而 dgemm 是列主要算法.我有兴趣知道，如果我要链接到 mkl ，切换矩阵的顺序是否会对 cblas_dgemm 算法产生任何影响. mkl 是否足够聪明，可以在幕后做一些事情来优化矩阵乘法呢?如果不 ..

发布时间：2021-04-02 20:32:41 c algorithm matrix blas intel-mkl 其他开发

Zheev特征值和向量不正确

我在Fortran科学代码中使用LAPACK zheev例程来计算不太大(可能永远不会超过1000大小)的矩阵的特征值和向量. 由于此步骤发生在计算的开始，所以我必须获得很高的精度，以避免重要的错误传播.问题在于，在我的测试用例中(仅使用12x12矩阵)，计算精度仅为1e-9左右，这根本不够. 我与numpy.linalg.eigh进行了比较，后者给出了可笑的更好结果，我想知道如何使用 ..

发布时间：2020-11-10 06:54:34 fortran lapack intel-mkl eigenvalue eigenvector 其他开发

在Fortran中传递不连续的数组部分

我正在使用intel fortran编译器和intel mkl进行性能检查.我通过调用将一些数组节传递给Fortran 77接口 call dgemm( transa,transb,sz_s,P,P,& a, Ts_tilde,& sz_s,R_alpha,P,b,tr(:sz_s,:),sz_s) 很明显，tr(:sz_s，:)在内存中不 ..

发布时间：2020-11-10 06:36:22 fortran intel intel-mkl 其他开发

intel-mkl相关内容

用C++将COO格式转换为CSR格式

为什么MatLab&；的mlDivide比dgels好得多？

告诉GCC不要链接libgomp，这样它就会链接libiop5

为什么在我使用 MKL 时 Tensorflow 会警告 AVX2?

如果参数大小大于 8192，为什么 numpy.sin 会返回不同的结果?

直接在 Scipy 稀疏矩阵上使用 Intel mkl 库以更少的内存计算 A 点 A.T

向 pip 提供 NumPy site.cfg 参数

Pyinstaller numpy“Intel MKL 致命错误:无法加载 mkl_intel_thread.dll"

使用英特尔 MKL 的 3D 卷积

增加主程序的堆栈大小或为递归代码块创建一个具有更大堆栈大小的新线程?

增加主程序的堆栈大小或为递归代码块创建一个具有更大堆栈大小的新线程?

检测是否在 Visual Studio 项目的属性中启用了英特尔 MKL

具有 mkl 后端的特征库的按系数数组操作的性能

OMP 并行区域内英特尔 MKL 函数的线程数

英特尔MKL和JNI:如何添加ld从中搜索符号的共享库?

对于小数据集，为什么使用cula(dgesv)求解线性方程组比mkl(dgesv)慢

将Ipopt与Intel MKL关联

MKL是否针对*主要订单优化cblas?

Zheev特征值和向量不正确

在Fortran中传递不连续的数组部分