benchmarking相关内容
我要一个基准C / C ++ code。我想衡量CPU时间,墙的时间和周期/字节。我写了一些测量功能,但有次/字节的一个问题。 要获得CPU时间我写了一个函数的getrusage()与 RUSAGE_SELF ,墙体时间我使用 clock_gettime 与单调,获得次/字节我用 RDTSC 。 我处理大小的输入缓冲区,例如,1024:字符缓冲区[1024] 。我怎么基准: 请热身阶段,
..
有两种方法可以零出一个整数/浮点数组: memset的(数组,0,sizeof的(INT)* ARRAYSIZE); 或的for(int i = 0; I< ARRAYSIZE ++ I) 数组[我] = 0; 显然,memset的是大快 ARRAYSIZE 。但是,在什么点是memset的开销实际上比for循环开销更大?例如,对于大小为5的阵列 - 这将是最好的?第一,
..
我试图找出做矩阵乘法的最快方法,并试图三种方式: 纯Python实现:这里没有任何惊喜 使用numpy的实施 numpy.dot(A,B) 使用 ctypes的模块在Python用C接口。 这是转化为一个共享库中的C code: 的#include<&stdio.h中GT; #包括LT&;&stdlib.h中GT;无效matmult(浮点*一,浮动* B,浮动* C中,in
..
有一个简单的库,以基准它需要执行C code的一部分的时候?我想是这样的: INT的main(){ benchmarkBegin(0); //做工作 双elapsedMS = benchmarkEnd(0); benchmarkBegin(1) //做一些更多的工作 双elapsedMS2 = benchmarkEnd(1); 双加速= be
..
我用逐步启用/页面上禁用的JavaScript(和CSS)影响的想法酝酿 - 这取决于如何快速/慢速浏览器似乎是 我特别想低功率移动设备和旧台式电脑 - 不只是IE6: - ) 是否有正在做这样的事情的任何例子吗? 什么是衡量这一目标的最佳途径 - 占的事情,比如在繁忙的CPU 暂时放缓? 注: 我不感兴趣的浏览器/操作系统检测。 在那一刻,我在带宽测量不感兴趣 - 唯一的浏览器/
..
我不知道我是否应该在这里发表这个问题,因为这似乎是一个面向对象程序设计的网站。 不过,我认为必须有一些在这里大师谁知道这一点。 现在我已经运行CentOS的5.我希望有一个相当大的C ++基于提升程序的编译器的AMD Opteron服务器。哪个编译器我应该选择? 解决方案 我希望这有助于超过伤害:) 我做了一点编译枪战有时在一年前,和我会断电记忆功能。 GCC 4.2(苹果)
..
我需要插座般的本地IPC。我用命名管道和重叠IO上的窗户,我想重写应用程序,以提高:: ASIO,以便它可以使用UNIX域套接字为好。 我最近审查libevent库的一部分,我知道它仅支持在1.4版本的Windows套接字()并选择()。作为重叠IO是非常有效的留出很明显这是在第2版(这是在阿尔法)被不客气不可接受性状。亚最佳实施的另一个例子是使用红 - 黑树与PRIO-队列这是不客气沿线的某个
..
我正在寻找一种编程技术,以确保用于基准变量(没有观察到副作用)将不会被编译器优化掉 这给出了一些信息,但我最终使用的愚蠢和下面的函数 / ** *呼叫doNotOptimizeAway(VAR)针对您使用的变量 *基准否则是没有用的。编译器倾向于做 *做好消除未使用的变量,而这个功能的傻瓜 *其实是在需要它变成思维变种。 * / #IFDEF _MSC_VER优化的#pragma(
..
只是看着JMeter的,从我我可以看到它是一个桌面应用程序,因此它是安全的,说我可以用它进行基准测试在Windows服务器上运行asp.net? 其他推荐的工具? 解决方案 是的,我成功地使用JMeter的与我的ASP.NET(不MVC)的网站。 这两个教程是一个天赐良机: http://blog.technicallyworks.com/2009/06/load-testing
..
比较操作时 VAR fat_cats = cats.slice() 到 VAR fat_cats =新阵列(cats.length) 的性能差异是令人困惑的。 在Firefox和Chrome 新阵列较慢(当它应该是更快,它只是分配一个空数组并没有这样做迭代结束吧) 凡在IE8 新阵列快(这只是混淆) 任何解释AP preciated。 基准 解决方案 想通了通过查看
..
为了量化C ++中的C-状阵列和载体的性能差异,我写了这个小程序。的https://github.com/rajatkhanduja/Benchmarks/blob/master/C%2B%2B/vectorVsArray.cpp 要比较它们的共同点,我决定测试无论是随机和顺序访问。我加了迭代器,只需将它们进行比较,同时(但不是问题的主要论点集中在什么)。 结果,对于一个64位的Lin
..
我用这个简单的算法进行矩阵乘法。要我用对象进行动态地包含创建的阵列的基质中更加灵活。 此相比解决我的第一个静态数组是慢4倍。我能做些什么,以加快数据访问?我并不想改变的算法。 矩阵mult_std(矩阵A矩阵B){ 矩阵C(a.dim(),假的,假的); 的for(int i = 0; I< a.dim();我++) 对于(INT J = 0; J< a.dim(); J
..
简介问题设置 我在做涉及一些基准 - 〜A 和 A == 0 为双阵列无提示NaN ,这两者的转换 A 来一个逻辑阵列,所有零转换为真正值和休息被设置为假值。 有关的标杆,我使用的输入数据的三套 - 非常小,小型数据 - 15:5:100 中小型数据 - 50:40:1000 中到大型数据 - 200:400:3800 输入与 A = ROUND(RAND(N)* 20)创建,
..
所以pretty每多ArrayList中有关能力的问题是如何使用它,或者(奇怪)访问它,我很熟悉的信息。我很感兴趣,它是否真的值得使用ArrayList的构造函数,如果你碰巧知道或有一个大概的了解有多少项目将在ArrayList中,设置容量? 有没有比较需要多长时间只使用天真的元素添加到一个ArrayList与任何COM prehensive基准pre-设置一个ArrayList的容量?
..
我最近被要求生产的MIPS因为我们开发了一种算法(每秒百万指令)。该算法是由一组C样式功能曝光。我们有锻炼code在戴尔Axim测试不同的输入下的性能。 这个问题来自我们的硬件供应商,但我大多是HL软件开发人员,所以我不知道如何响应请求。也许有人有类似HW / SW背景可以帮助... 由于我们的算法是不实时,我不认为我们需要把它作为量化MIPS。是否有可能只是引用的汇编指令总数是多少?
..
我遵守了对SPARC V8 32位架构的一些基准测试应用程序。我用他们SPARC 32位处理器的性能评估。然而,一些应用达不到性能。我想测试与64位SPARC V9架构的性能(如的OpenSPARC T1 / T2)。我的问题是将在SPARC V9架构没有任何修改的32位SPARC V8架构编译的二进制文件运行吗?在这两种架构的二进制兼容? 解决方案虽然也许在新的版本,您使用的是相同的操作系
..
我在做性能测试,对我的硕士论文,我得到Symfony2的简单应用程序的性能非常差。这是简单的应用程序,一个查询和一些数学。 有关命令测试结果: AB-C10 -t60 HTTP://sf2.cities.localhost/app.php 服务器软件:阿帕奇/ 2.2.20 服务器主机名:sf2.cities.localhost 服务器端口:80文件路径:/app.php 文件长度:20
..
我有关于延迟基准的问题。我在5台机器(一个领导者,其余都是追随者)的集群运行Apache ZooKeeper的。有用于测序请求发送到协议另一个机(客户端)。 我管理运行一个基准程序,持续pre-选定的时间,目的是同时并连续请求发送到每个服务器的ZooKeeper。当pre-选择的时间后,我可以看到延迟的结果。 但是,在上述基准仅使用一个客户机运行基准code。现在,我想增加客户机的数量,使更多
..
我在Ubuntu虚拟机中使用Apache 2.4.2。 我用这个来加载测试,发送请求到一些HTTPS URL。 失败的请求数是零。但没有我的要求,才能真正被处理(抬头数据库的话)。 在相同的URL,调用它通过浏览器就可以了(数据库更新)。 所以这是纯粹的Apache基准的问题。 这里是我的Apache基准命令: AB -n 100 -c 10 -k -f ALL -g“/home/
..
我打算安装nginx的反向代理服务器。我将有阿帕奇提供我的动态内容,而Nginx的将提供静态内容。 我的配置,我现在就是Apache的FastCGI的。这给了我没有配置问题和运行伟大。 我已经建立了nginx的后,我要运行一些基准测试,看看是否我真的得到了一些性能的提高,否则我会切换回来。 有谁知道我可以基准这种类型的设置?或者,也许有人这样做已经,并且有一定罐头的结果,我会很高兴听到他们的
..