statistics相关内容

再presenting连续概率分布

予有涉及的连续概率分布函数,其中大部分是凭经验确定(例如出发时间,运输时间)的集合中的问题。我需要的是采取两个这样的PDF文件,并​​进行算术运算的一些方法。例如。如果我有两个值x取自PDF X,和PDF Y Y取,我需要得到的PDF为(X + Y),或任何其他操作F(X,Y)。 这是解析解是不可能的,所以我正在寻找的是PDF文件的一些重新presentation,允许这样的事情。一个明显的(但 ..
发布时间:2015-11-30 15:52:24 C/C++

排序已知的统计分布数据的算法?

这只是发生在我,如果你知道的数据进行排序的一些有关分布(在统计意义上的),一个排序算法的性能,如果你把这些信息纳入考虑可能会受益。 所以我的问题是,是否有任何的排序算法考虑到这方面的信息?如何好,他们是谁? 编辑:一个例子来阐明:如果你知道你的数据的分布是高斯,你可以为你处理数据估算均值和平均的飞行。这会给你每一个号码,你可以用它来关闭它们放置到最终位置的最终位置的估计。 编辑#2:我是pr ..
发布时间:2015-11-30 15:49:49 C/C++

有效地把相似的数字相加

可能重复: 维数阵列集群 我有数字数组像 [1,20,300,45,5,60,10,270,3] 。什么是一个高效的算法基于接近分组这些数字相加?在这种情况下,我期望像 [1,3,5] , [20,45,60] 和 [270,300] 。 解决方案 你问的最难的是如何真正界定接近。你会期望的输出从 [5,10,15,20] ?难道是相同的分组为 [500,1000,1500,2000] ? ..
发布时间:2015-11-30 15:45:34 C/C++

比较多的价格选择众多客户算法

我们有百万客户。货物为他们每个人的销售成本可以pssed为价格A或价B EX $ P $。 价格A<<价B 价格A和价B不是线性对方。在某些情况下,B是昂贵的2倍,在一些它是100倍。 所有的客户以成本为 分((SUM(A)/数(A)),100)*数量(A) 有效地,如果是小于100的所有客户的A上的平均成本将舍入为100 有没有这样的限制,基于B。 我想花最少的钱,自己的 ..
发布时间:2015-11-30 15:41:39 Python

有效地寻找数组中的元素的行列?

怎样才能找到一个数组中的每个元素的等级,在出现并列的情况平均,有效?例如: 浮法[]等级(T)(T []输入){ //实现 } 自富=等级([3,6,4,2,2]); // foo的== [3,5,4,1.5,1.5] 我能想到这样做的唯一方法需要分配3数组: 输入数组的一个副本,因为它已经被排序,我们不拥有它。 的数组来跟踪在其中输入数组进行排序的顺序。 行列的数组返回 ..
发布时间:2015-11-30 15:39:51 C/C++

关联字接近

让我们说我有一个对话的文字抄本经过一段aprox的了。 1小时。我想知道发生在靠近proximatey什么话彼此。我会用什么样的统计方法来确定什么话都聚集在一起,另一个是他们的proximatey有多近呢? 我怀疑某种聚类分析和主成分分析。 解决方案 要确定字接近,你就必须建立一个图: 每个字是一个顶点(或“节点”),和 在左,右的话是边 所以,“我喜欢狗”将有2边和3个顶点。 现在, ..
发布时间:2015-11-30 15:21:38 C/C++

自动对比两个系列-Dissimilarity测试

我有两个系列,系列1和系列2。我的目标是要找到多系列2如何不同于系列1,上仓至仓的基础上,(每个箱子重presents的具体特征,)自动/定量。 //img713.imageshack:此图像可以通过的点击这里。 系列1是预期的结果。 系列2是测试/传入系列 我提供直方图,其中系列2重新psented在深褐色$ P $。你还可以注意到在x轴之间221和353有一个显著变化。即系列2小于系列1。 ..
发布时间:2015-11-30 15:16:45 C/C++开发

计算标准偏差在循环缓冲器

我需要计算值的标准偏差被存储在循环缓冲器。最终的算法将运行一个资源有限的设备上,所以我想这是尽可能轻。天真的做法是,一个新的值被压在每次重新评估的标准偏差在整个缓冲区,但是这将是非常缓慢的。理想情况下,我想一个算法,动态更新的标准偏差的当前值作为新的值被推入。 维基百科报道的一些技术进行快速计算,但他们可以在数据流中使用:在我的情况下,当一个新值推入,标准差的计算方法,如果已经弹出的最后一个值不 ..
发布时间:2015-11-30 15:15:35 C/C++

啃啃拼图加数:REDUX A(修正)的非递归算法

这个问题涉及啃啃拉丁广场拼图这要求你找到ncells数字的所有可能的组合与值x,使得1 LT的部分; = X< = MAXVAL和X(1)+ ... + X(ncells)= targetsum。已经测试了几个比较有希望的答案,我要奖励的答案 - 奖伦纳特Regebro,因为: 他的程序是一样快,我的(±5%),以及 他指出,我原来的程序有错误的地方,这使我明白它真正想要做的事情。谢 ..
发布时间:2015-11-30 15:14:30 Python

选择随机数组元素满足某些财产

假设我有一个表,名为元素,其中每个或不符合某些布尔属性 P 。我想选择的要素之一是满足 P 随机均匀分布。我不知道时间提前很多项目如何满足这个属性 P 。 将以下code做到这一点: pickRandElement(元素,P) randElement = NULL 数= 0 在元素的foreach元素 如果(P(元)) ..
发布时间:2015-11-30 15:09:42 C/C++

简明矩阵功能找到对的

有关的一组观察: [A1,A2,A3,A4,A5] 他们的成对距离 D = [0,A12,A13,A14,A15] [a21,0,A23,A24,A25] [A31,a32,0,A34,A35] [A41,A42,a43,0,A45] [A51,A52,A53,a54,0] 在一个浓缩的矩阵形式给定(以上的上三角,从计算的 scipy.spatial ..
发布时间:2015-11-30 14:58:02 Python

OpenCV的线拟合算法

我想了解OpenCV的这是来自OpenCV的code片段: icvFitLine2D功能 - 我看到有一些随机函数,选择点近似,然后计算距离从点到fited线(带choosen点),然后选择的其他点,并试图尽量减少与choosen distType距离 有人可以明确的解决方案 (这是一个老问题,但这个问题引起了我的好奇心) OpenCV的FitLine implemements两种不同的机制 ..
发布时间:2015-11-30 14:57:00 C/C++

方法地理标记或Geolabelling文本内容

有什么好的算法,用于与该城市/地区或原产地标记自动文本?也就是说,如果一个博客是纽约,我怎么能告诉编程。是否有包/论文,声称有任何把握做到这一点? 我也看了一些基于TFIDF方法,专有名词的十字路口,但到目前为止,没有任何引人注目的成功,而且我AP preciate的想法! 在更普遍的问题是有关分配课文题目,题目给出了一些列表。 pferred到全贝叶斯方法简单/幼稚的方法$ P $,但我开 ..
发布时间:2015-11-30 14:50:27 C/C++

算法不放回抽样?

我想测试数据的特定群集发生是偶然的可能性。鲁棒的方式来做到这一点是蒙特卡洛仿真,在其中数据和组之间的关联是随机重新分配大量的时间(如10,000),和集群的一个度量是用于实际的数据与模拟,以确定AP比较值。 我已经得到了大部分这方面的工作,用指针映射分组的数据元素,所以我打算随机重新分配数据指针。问题:什么是一个快速的方式,无需更换样品,让每一个指针在复制数据集的随机重新分配 例如(这些数据只 ..
发布时间:2015-11-30 14:46:34 C/C++

在线算法计算标准偏差

通常情况下,我有更多的技术问题,但我将简化它为你计算球的例子。 假设我有不同颜色的球和一个数组的一个索引(初始化为全0)保留每种颜色。每次我挑了一个球,我增加了相应的指数1。 球都是随机挑选,我只能挑一球的时间。我唯一​​的目的是计算球的数量为每一种颜色,直到用完了球。 我想计算出不同颜色的球数的标准差,的而我指望他们的。我不希望由具有通过阵列一次迭代我与计算所有的球完成后计算。 要显现: ..

什么是计算平均,所有值的总和超过了双重的限制好的解决办法?

我有一个要求,计算一个非常大的组双打(10 ^ 9值)的平均值。该值的总和超过上限的两倍,所以没有人知道任何整洁的小动作,用于计算,不也需要计算总和? 我使用的Java 1.5。 解决方案 我想问您的第一个问题是这样的: 请您事先知道值多少? 如果没有,那么你别无选择,只能进行总结,并计数和差距,做了平均水平。如果双击不够高precision来处理这个问题,那么倒霉,你不能使用双击,你需 ..
发布时间:2015-11-30 14:15:25 Java开发

生成整数的C语言的均匀分布

我已经写了一个C函数,我认为选择从均匀分布与范围[rangeLow,rangeHigh]整数,包容性。这不是功课 - I'm只是用这种方式是嵌入式系统修修补补,我做的乐趣 在我的测试情况下,code能够产生相应的分配。我感觉不完全相信,实施是正确的,但。 可能有人做了仔细的检查,让我知道,如果我做错了什么吗? // uniform_distribution返回[rangeLow,rangeH ..
发布时间:2015-11-30 13:52:03 C/C++

计算两个列表之间的相似性

编辑: 因为每个人都被弄糊涂,我想简化我的问题。我有两个有序列表。现在,我只想如何计算类似一个列表是另一个。 例如, 1,7,4,5,8,9 1,7,5,4,9,6 什么是这两个列表之间的相似性一个很好的措施,这样的顺序是非常重要的。例如,我们应该惩罚相似度为4,5的交换两个列表? 我有2个系统。艺术系统的一个状态,我实现的一个系统。给定的查询,这两个系统返回的文档的排名列表。现 ..
发布时间:2015-11-30 13:51:12 C/C++

C#正态随机数

我想创建一个函数,接受双平均值,双偏差,并返回一个随机数与正态分布。 例如:如果我通过在5.00的平均值2.00作为偏差的时候68%,我会得到3.00和7.00之间的数字。 我的统计是有点弱...。任何人有一个想法,我应该如何处理呢?我的实现将是C#2.0中,但随时只要数学函数是标准在您所选择的语言来回答。 我觉得在此先感谢您的帮助。 解决方案 请参阅此$ C $的CProject文章: ..
发布时间:2015-11-30 13:48:44 C#/.NET

"在线" (迭代器)算法,估算统计位数,众数,偏度,峰度?

有一个算法来估算位数,众数,偏度,和/组值的或峰度,但这并不需要存储在内存中的所有值一次? 我想计算的基本统计信息: 的意思是:算术平均值 变化:从的均值偏差的平方 标准差:方差的平方根 位数:值从较小的半分隔更大数目的一半 模式:在设置中最常见的值 偏度:TL;博士 峰度:TL;博士 基本公式计算任何这些是等级学校的算术,我也认识他们。有迹象表明,实现了他们很多的统计库,也是如此。 我的 ..
发布时间:2015-11-30 13:30:40 C/C++