profiling相关内容

Eclipse indigo 的 Tomcat 应用程序探查器

我尝试在 Eclipse indigo 中安装 TPTP 分析器.但是它不起作用我收到以下错误. Eclipse TPTP 不支持您的平台.综合代理控制器将被禁用.要在受支持的主机上进行分析,请在该主机上安装和使用独立的代理控制器. 我不知道如何检查我的应用程序中的 sql 内存泄漏.是否有任何其他 Eclipse 工具来检查内存泄漏.我想分析托管在 Tomcat 中的 Web 应用程 ..
发布时间:2022-01-16 13:52:06 Java开发

如何转储 Permgen?

我想获取应用服务器 Permgen 的转储. 我不想使用 -XX:+TraceClassLoading -XX:+TraceClassUnloading 因为我不想重新启动服务器,也不想使用 jconsole. 我有任何工具,如 jmap(用于堆转储没有找到 permgen 的任何选项)来获取 permgen,因此我只能提供 pid. 解决方案 jmap -permstat ..
发布时间:2022-01-16 12:23:04 其他开发

是否有一种简单的方法可以在 Java 中获取特定类的所有对象实例

目前我正在开发一个 Java 代理来组装内存统计信息.借助 instrumentation API 我可以掌握这些类(并操纵它们).使用纯 Java,我可以估计每个对象使用的资源.到目前为止,一切顺利. 我现在面临的问题是“如何获取特定类的每个 Object 实例".我可以进行字节码操作以获取对象实例,但我希望有另一个我不知道的 API,帮助我在没有如此繁重的侵入步骤的情况下完成我的目标.最 ..
发布时间:2022-01-16 11:53:58 Java开发

如何分析 Kivy 应用程序?

我正在使用 Kivy 构建游戏.我遇到了性能问题,所以我决定分析该程序. 我尝试通过以下方式运行它: python -m cProfile main.py 应用程序屏幕保持黑色.几秒钟后,一个异常使程序崩溃: Traceback(最近一次调用最后一次):_run_module_as_main 中的文件“c:\python27\Lib\runpy.py",第 162 行"__main_ ..
发布时间:2022-01-15 09:39:18 Python

Fortran 和 MPI 的良好分析器

对于包含 MPI 的 Fortran 代码库,您使用哪个分析器?gprof 似乎无法正常工作.Sun Studio Analyzer 仅返回 C/C++ 系统调用的计时,并且不显示任何 fortran 函数. 解决方案 有许多专门用于并行/MPI 程序的性能分析工具,例如: Score-P,适用于多种不同的分析工具,例如Cube, 吸血鬼 HPCToolkit 仅使用采样,因此您不 ..
发布时间:2022-01-14 09:27:39 其他开发

分析 python 多处理池

我正在尝试在多处理池中的每个进程上运行 cProfile.runctx(),以了解我的源中的多处理瓶颈是什么.这是我正在尝试做的一个简化示例: 来自多处理导入池导入 cProfile定义方(i):返回 i*idef square_wrapper(i):cProfile.runctx("结果 = square(i)",globals(), locals(), "file_"+str(i))# Na ..
发布时间:2022-01-12 13:08:05 Python

Visual Studio Profiler 显示“[损坏]"作为函数名

我正在尝试分析我的 c++ dll,但分析器无法与我一起使用.我想查看调用树等等,但只有 stl 函数显示,而且并非全部不相交 - 当我点击任何函数时,它们的调用者是“[broken]". 我不知道我的 google 技能是否不够,但我找不到任何关于 [broken] 意味着什么以及如何修复它的信息. 这是一个调试版本.我不能保证这不是由于某些编译器设置造成的,但我觉得我什么都试过了. ..

如何将 etrace 与动态库一起使用以按时间顺序跟踪 C++ 中的函数调用?

背景: 我有一个大型模拟工具,我需要了解它的逻辑行为.为了做到这一点,如果我有函数调用的时间顺序,我会得到最大的帮助,作为一个最小的工作示例. 我在网上找到了很多工具,例如 CygProfiler 和 etrace.在找到解决方案时我变得非常痛苦,以至于我开始遵循最疯狂的解决方案,即在调试器中使用“step into".如果您有一个小程序但没有完整的模拟工具,这是一个不错的选择. ..
发布时间:2022-01-11 20:12:06 C/C++开发

有没有办法在 C++ 函数中获取函数名?

我想实现一个函数跟踪器,它会跟踪一个函数执行的时间.我有以下相同的课程:- 类 FuncTracer{上市:FuncTracer(LPCTSTR strFuncName_in){m_strFuncName[0] = _T('\0');如果(strFuncName_in ||_T('\0') != strFuncName_in[0]){_tcscpy(m_strFuncName,strFuncNa ..
发布时间:2022-01-11 19:21:33 C/C++开发

Android 软件 NDK 原生 c 代码在实际 Android 手机上的分析

我正在使用日志原生代码在 Android 上开发一个相当大的软件,它现在可以运行,但存在一些性能问题. 我希望我可以在几款真正的安卓手机上分析软件的每个模块(函数调用)的 CPU 周期、内存使用情况等.是否有一个简单的 c 库可以做到这一点? 我看到有人在使用 oprofile,这对我来说似乎有点过头了,因为它是一个系统狂野的分析器,它需要重建内核和系统映像. 由于我拥有我的应用 ..
发布时间:2022-01-10 23:24:04 移动开发

CUDA:Nsight VS2010 profile __device__ 函数

我想知道如何使用 Visual Studio 2010 上的 Nsight 2.2 分析 __global__ 函数内部的 __device__ 函数.我需要知道哪个函数正在消耗大量的资源和时间.我在 CC 2.0 上有 CUDA 5.0. 解决方案 Nsight Visual Studio Edition 3.0 CUDA Profiler 引入了源相关实验.Profile CUDA A ..
发布时间:2022-01-10 16:05:55 其他开发

什么是“其他"?Nsight 分析器显示的问题停顿原因?

我的内核在 CC 3.0 (Kepler) 上的性能比在 CC 2.0 (Fermi) 上的性能差.在 Nsight 分析器中,Warp Issue Efficiency 图表显示 60% 的时间没有符合条件的 warp,Issue Stall Reasons 图表显示 60%这些是由于“其他"造成的. 我想知道其他问题停滞的原因是什么以及我可以做些什么来减少它们. CUDA 5.0. ..
发布时间:2022-01-10 15:59:57 其他开发

如何计算 CUDA 内核的实现带宽

我想要衡量我的内核存档的峰值内存带宽有多少. 假设我有一个 NVIDIA Tesla C1060,它的 最大带宽为 102.4 GB/s.在我的内核中,我可以访问以下全局内存: ...for(int k=0;k>4000;k++){浮动结果 = (in_data[index]-loc_mem[k]) * (in_data[index]-loc_mem[k]);……}out_data[索引 ..
发布时间:2022-01-10 15:52:38 其他开发

分析我的代码(开源)和第 3 方代码(闭源)的内存使用情况的最佳策略

我很快将负责对用 C/C++ 编写并使用 CUDA 来利用 GPU 处理的代码进行适当的内存配置. 我最初的想法是创建宏和运算符重载,以便我在源代码中跟踪对 malloc、free、delete 和 new 的调用.我将能够包含不同的标题,并使用 __FILE__ 和 __LINE__ 宏将内存调用打印到日志文件.这种类型的策略可以在这里找到:http://www.almostinfinit ..
发布时间:2022-01-10 15:52:09 C/C++开发

你是如何描述的?优化 CUDA 内核?

我对 CUDA 可视化分析器和占用电子表格有些熟悉,尽管我可能没有尽可能地利用它们.剖析与优化 CUDA 代码不像分析 &优化在 CPU 上运行的代码.因此,我希望从您的经验中学习如何充分利用我的代码. 最近有一篇帖子在寻找最快的代码来识别自我编号,以及我提供了 CUDA 实现.我对这段代码的速度并不满意,但我不知道什么是正确的问题以及我可以从什么工具中得到答案. 您如何确定使您的 C ..
发布时间:2022-01-10 15:29:42 其他开发

带宽的 nvprof 选项

从命令行使用 nvprof --metrics 测量带宽的正确选项是什么?我正在使用 flop_dp_efficiency 来获取峰值 FLOPS 的百分比,但是手册中似乎有很多带宽测量选项,我并不真正了解我在测量什么.例如dram_read、dram_write、gld_read、gld_write 在我看来都一样.另外,我是否应该通过假设两者同时发生来将带宽报告为读+写吞吐量的总和? 编 ..
发布时间:2022-01-10 15:25:36 其他开发

如何计算内核的 Gflops

我想要衡量我的内核存档的峰值性能有多少. 假设我有一个 NVIDIA Tesla C1060,它的 峰值 GFLOPS 为 622.08 (~=240 核 * 1300MHz * 2).现在在我的内核中,我计算了每个线程 16000 次失败(4000 x(2 减法,1 乘法和 1 sqrt)).所以当我有 1,000,000 个线程时,我会想出 16GFLOP.由于内核需要 0.1 秒,我将 ..
发布时间:2022-01-10 15:21:52 其他开发

如何确定在 C 程序中执行的 x86 机器指令的数量?

我目前正在解决一个家庭作业问题,该问题要求我找出在运行我用 C 编写的短程序时执行的机器代码指令的数量. 这个问题说我可以使用任何我想弄清楚的工具,但我对 C 相当陌生,并且不知道如何去做. 我需要什么类型的工具来解决这个问题? 解决方案 术语:您要求的是动态指令计数.例如每次执行时计算循环内的指令.这通常与性能大致相关,但每个周期的指令可能会有很大差异. CPU 周期是 ..
发布时间:2022-01-06 12:29:48 其他开发

在哪里可以找到要在 Visual Studio 2008 中使用的 C# 应用程序的探查器?

我正在为我在 Visual Studio 2008 中开发的 C# 应用程序寻找分析器.我正在寻找价格低廉(首选开源)并且可以集成到 VS2008 中的东西.我找到了 Visual Studio Profiler 但我没有知道如何使用它.我安装了独立版本,它依赖于 Visual Studio(我猜不是独立版本?)但是工具菜单中从来没有像他们的演练说的那样显示. 解决方案 这里是开源 .Ne ..
发布时间:2022-01-05 19:40:42 C#/.NET