profiling相关内容

如何在IntelliJ中做Spring批量应用的性能分析和调优?

我有一个在VM中运行的Spring批处理应用程序,处理10k条记录需要2个小时。 我们计划将应用程序迁移到Azure Kubernetes,我看到迁移的应用程序需要6个小时。 我需要进行必要的更改以满足当前性能。 我们没有对代码进行任何重大更改。 如何分析IntelliJ中的性能问题?是否有其他方法可以找到影响性能的原因。 注意:我没有appDynamic。 J ..
发布时间:2022-09-01 13:57:08 其他开发

如何找出我的代码中哪些部分在Python中效率低下

在前面的一个问题上,我问了一个关于多处理的问题,即使用多核来使程序运行得更快,有人告诉我: 通常情况下,与多处理相比,您可以通过更好的代码实现100倍以上的优化,而不是4倍的改进和额外的复杂性 然后他们建议我应该: 使用探查器了解速度较慢的原因,然后专注于优化。 所以我问了这个问题:How can you profile a script? 在这里我找到了cProfi ..
发布时间:2022-07-01 22:32:35 Python

NSight Compute表示:此设备不支持分析-为什么?

我有一台配备了NVIDA GTX 1050Ti GPU(计算能力6.1)的计算机,正在尝试在我用CUDA 11.4构建的程序中分析一个内核。我的操作系统发行版是Devuan GNU/Linux 4 Chimaera(~=Debian 11 Bullseye)。 NSight Compute启动我的程序,并在API调用后向我显示API调用,但当我到达第一次启动内核时,它在API调用清单的详细信 ..
发布时间:2022-04-25 14:28:17 其他开发

Java:内存分析器工具(MAT)用法:比较两个堆转储

我使用的是Eclipse+MAT插件。我可以看到一个.hprof文件堆历史记录,我为我的Java应用程序拍摄了两个快照。我希望当我比较两个堆转储时,我可以计算出哪个对象实例增加了很多,这样我就可以识别内存泄漏的可能性。 netbean可以做到这一点吗? 推荐答案 说明 在MAT 中打开两个堆转储 打开显示异常行为的堆转储(通常是内存或线程使用率较高的堆转储)的直方图。 ..
发布时间:2022-03-23 19:03:47 Java开发

使用Perf查找线程瓶颈并优化占用时间

使用perf record对CPU周期进行采样对于查找内核利用率大致恒定的优化候选者非常有用。但是,对于具有多个并行度不同的阶段的代码,计算CPU周期将非常强调并行阶段,而不强调影响墙时间的顺序或有限并行阶段。简而言之,简单使用Perf可能会突出显示amdahl's law 的错误分支 因此,问题是如何让perf record/perf report找到缩短运行时间的优化候选者,可以是一致并行 ..
发布时间:2022-03-23 18:59:12 服务器开发

在Linux上测量TLB未命中的命令

请告诉我Linux上TLB未命中的测量命令好吗?是否可以将次要页错误视为TLB未命中? 推荐答案 您可以使用perf执行此操作。只要您的CPU支持它。 使用perf list了解可用的计数器。当我拿起这个列表并贪婪地想要TLB(在我的Sandy Bridge机器上)时,我得到: rob@tartarus:~$ perf list | grep -i tlb dTLB-loa ..
发布时间:2022-03-23 18:52:09 服务器开发

使用IPython魔术的Time Python脚本

如何使用IPython%time或%%timeit魔术命令对Python脚本的执行进行计时?例如,我有script.py,我想知道执行它需要多长时间。细微差别:script.py需要输入参数。以下选项似乎不起作用。 %%time script.py input_param1 input_param2 推荐答案 解决方案 您可以使用: %%timeit %run scri ..
发布时间:2022-03-23 18:49:18 Python

PERF_EVENT_PARANOID==1实际上对x86 PERF施加了什么限制?

较新的Linux内核有一个可调的sysfs/proc/sys/kernel/perf_event_paranoid,允许用户为非根用户调整perf_events的可用功能,数字越大越安全(提供的功能相应较少): 从kernel documenation我们可以看到各种值的以下行为: PERF_EVENT_PARANOID: 控制非特权用户对Performance Events系统的使 ..
发布时间:2022-03-23 18:46:30 其他开发

导出Android Studio Profiler数据

在使用Calabash执行自动化UI测试时,我需要以某种方式分析我的Android应用程序。从我的网络搜索中我得到的是,内置的Android监视器是进行侧写的最佳选择。问题是我需要导出配置文件数据,最好是以Excel友好的格式导出。 我需要的: 负载,例如%中的CPU 时间 有没有办法将Android监视器配置文件数据导出到文本文件或等效文件?或者,我可以用安卓显示器以外的其他 ..
发布时间:2022-03-23 18:44:19 移动开发

如何调试类型脚本编译性能问题

我的打字项目已经进行了一段时间了,而且相当大。最近,编译时性能变得非常糟糕。我认为很可能是我在某处提到的一些“整洁”的打字技巧导致了这种情况。 遗憾的是,这是一个大型项目,并且包括许多其他大型打字脚本依赖项,因此很难知道确切的根本原因。 在这种情况下,有没有什么工具可以调试TS编译器的类型检查性能?例如,查看哪些文件/类型需要花费打字脚本最多的时间进行编译。 推荐答案 ty ..
发布时间:2022-03-23 18:42:00 其他开发

如何分析启动缓慢的Bash外壳脚本?

我的Bash shell最多需要3-4秒才能启动,而如果我用--norc启动它,它会立即运行。 我通过手动插入return语句并寻求速度提升来启动";分析";/etc/bash.bashrc和~/.bashrc,但这不是一个量化过程,效率不高。 如何分析我的Bash脚本,并查看哪些命令执行时间最长? 推荐答案 如果您有GNUdate(或其他可以输出纳秒的版本 ..
发布时间:2022-03-23 18:37:07 其他开发

您推荐哪些工具来分析 Rails 应用程序?

我一直在寻找 Rails 的分析工具.我目前正在玩和测试 ruby​​-prof 和 railsbench,但我对使其正常工作所需的大量调整和修改感到有点沮丧. 虽然我不介意(太多)调整,但我想知道是否有其他更直接且易于使用的工具来分析 Rails 应用程序?您推荐哪些工具? 解决方案 New Relic 提供 Rails 分析包括 免费的“精简版" 版本. ..
发布时间:2022-01-31 15:15:36 其他开发

Julia:如何分析并行代码

在 Julia 中分析并行代码的合适方法是什么?当我跑步时 @profile foo(...) foo 是我的函数,我得到了 朱莉娅>Profile.print()第1234章匿名的;线路:234 多.jl;remotecall_fetch;线路:6952 多.jl;发送消息_;线路:1722 序列化.jl;连载;线路:742 序列化.jl;连载;线路:2992 序列化.jl;连载;线路:1 ..
发布时间:2022-01-23 19:51:21 其他开发

在 C# 中分析方法以了解运行需要多长时间

我需要获取时间报告以了解在类中运行 C# 方法需要多长时间.我考虑使用 profiler 来做到这一点. 输入是类中方法的名称,输出是 什么方法/类调用这个方法. 运行方法的时间量. Visual Studio 2010 和 Mono 有哪些工具/商业产品可用? 解决方案 另一个开源分析器是 slimtune http://code.google.com/p/slimt ..
发布时间:2022-01-23 15:03:45 C#/.NET

如何调试 Windows Store 应用程序中的内存泄漏?

所以我有一个 .NET Windows Store 应用程序正在泄漏内存.我能做些什么呢?我用于 jetBrains 或 Red-Gate/ANTS 桌面应用程序的分析器工具不支持 Metro 应用程序(或者现在支持吗?) 解决方案 对于最简单的方法 - 跳到底部阅读有关使用 Visual Studio 2013 执行此操作的说明. 现在可能会有一些新工具 - 可能是更新后的 Vis ..
发布时间:2022-01-21 13:59:26 C#/.NET

如何以毫秒为单位获取时间

由于字符串连接的性能在 VB6 中非常弱,我正在测试几个 StringBuilder 实现.要查看它们运行了多长时间,我目前使用内置的 定时器 函数,它只给我午夜后经过的秒数. 有没有办法(我猜是通过导入系统函数)来获得毫秒精度的东西? 解决方案 是的,你可以使用 Win32 API: DWORD WINAPI GetTickCount(void); 要在 VB6 中导入它, ..
发布时间:2022-01-20 19:26:43 其他开发

如何测量网络性能(如何对网络协议进行基准测试)

首先,有一点背景.分布式版本控制系统 (DVCS) 有许多不同的比较,它们比较存储库的大小或操作的基准速度.我还没有找到任何可以对各种 DVCS 和所使用的各种协议的网络性能进行基准测试的方法……除了测量涉及“克隆"、“拉取"/“获取"或“推送"等网络的操作(命令)的速度. 我想知道你会如何进行这样的比较;如何测量应用程序的网络性能,或如何对网络协议进行基准测试.我在这里设想还测量性能对网络 ..