binning相关内容

panda df迭代,基于时间的数据装箱(以毫秒为单位)

我重新集中了我的问题,并尝试尽可能具体.在下面,我还包括到目前为止使用的代码; (1)从SQL中提取数据时,我的时间是混合格式,其中包含一个很难使用的字母.为了避免出现问题,我尝试提出申请;df.time = pd.to_timedelta(df.time,unit ='ms'),这很好,因为它不知道如何提取小时和分钟.例子; 2019.11.22D01:18:00.01000,我只需要以以 ..
发布时间:2021-05-30 21:22:33 Python

当使用cut in pandas数据框对其进行装箱时,为什么装箱未正确完成?

我有一个数据框,我想按一列进行分类(即分组为子范围),并对每个分类取第二列的平均值: 将pandas导入为pd将numpy导入为npdata = pd.DataFrame(columns = ['Score','Age'])data.Score = [1,1,1,1,0,1,2,1,0,1,1,0,2,1,1,2,1,0,1,1,-1,1,0,1,1,0,1,0,-2,1]data.Age = ..
发布时间:2021-05-13 19:50:28 Python

基于度量值的PowerBI动态装箱(范围更改)

我正在尝试通过装箱表示一些连续的数据.区域的连续加权数据应归类为:VeryHigh,High,Low,VeryLow.权重值基于按区域分组的某些事件类型之间的相互作用,因此可以根据报表用户选择的类型进行更改. 我在下面提供了一些示例数据,并概述了到目前为止所做的事情. 从五组区域数据(A-E)开始.在每个事件中都有一个或多个事件类型.每个事件都有一个权重及其在区域内发生的次数(计数). ..
发布时间:2021-04-29 20:10:55 其他开发

Google图表直方图的公式

Google图表用于构建直方图的公式是什么?例如,它是否使用Sturge规则?杜恩的法则?斯科特的法则?等等.是否有任何文档说明如何构造默认箱大小,最小和最大? 这里是 直方图 Google图表的页面. Google图表会自动为您选择垃圾箱数.所有容器的宽度均等,高度与容器中数据点的数量成正比.在其他方面,直方图类似于柱状图. 解决方案 在 ..

如何对齐两个numpy直方图,以便它们共享相同的bin/index,并将直方图频率转换为概率?

如何将两个数据集X和Y转换为x轴/索引相同的直方图,而不是将变量X的x轴范围统称为低于或高于变量Y的x轴范围(例如下面的代码生成)?我希望将numpy直方图的输出值准备好之后再绘制在共享的直方图中. import numpy as np from numpy.random import randn n = 100 # number of bins #datasets X = randn ..
发布时间:2020-11-23 06:49:16 Python

R-hist(XX,plot = FALSE)$ count的更快替代方法

我正在寻找一种更快的替代R的hist(x, breaks=XXX, plot=FALSE)$count函数的方法,因为我不需要生成任何其他输出(因为我想在sapply调用中使用它,因此需要进行一百万次迭代其中将调用此函数),例如 x = runif(100000000, 2.5, 2.6) bincounts = hist(x, breaks=seq(0,3,length.out=100), ..
发布时间:2020-11-23 06:40:08 其他开发

Matplotlib:如何制作具有相等面积的垃圾箱的直方图?

给出一些遵循任意分布的数字列表,如何定义matplotlib.pyplot.hist()的bin位置,以使每个bin中的面积等于(或接近)某个恒定面积A?面积应通过将垃圾箱中的项目数乘以垃圾箱的宽度计算得出,其值应不大于A. 这是一个MWE,用于显示带有正态分布样本数据的直方图: import matplotlib.pyplot as plt import numpy as np x ..
发布时间:2020-11-23 06:36:10 Python

Python:如何使用大小相同的垃圾箱制作直方图

我有一组数据,并且想要对其进行直方图处理.我需要这些垃圾箱具有相同的 size ,这意味着它们必须包含相同数量的对象,而不是更常见的(empy.histogram)等距间隔 /em>垃圾箱. 这自然会以垃圾箱宽度为代价,而垃圾箱宽度可能会有所不同,并且通常会有所不同. 我将指定所需箱的数量和数据集,以获取箱边缘作为回报. Example: data = numpy.array([1., ..
发布时间:2020-11-23 06:35:37 Python

使用gnuplot的直方图?

如果我的.dat文件已经具有正确的装箱数据,我知道如何在gnuplot中创建直方图(只需使用"with box").有没有办法获取数字列表并让gnuplot根据用户提供的范围和容器大小提供直方图? 解决方案 是的,它虽然既隐藏又快速简单: binwidth=5 bin(x,width)=width*floor(x/width) plot 'datafile' using (bin( ..
发布时间:2020-11-16 03:55:43 其他开发

将年月字符串转换为带有间隔的三个月垃圾箱-如何分配连续的升序值?

我已使用下面的代码将year.month字符串“ bin”到三个月的bin中。问题是我希望每个垃圾箱都有一个数字,该数字对应于垃圾箱按时间顺序出现的位置(即第一个垃圾箱= 1,第二垃圾箱= 2,依此类推)。现在,第一个月的垃圾箱已分配给数字4,但我不确定为什么。任何帮助将不胜感激! >头(Master.feed.parts.gn $ yr.mo,n = 20) [1]“ 2007.10”“ ..
发布时间:2020-10-18 19:00:12 其他开发

R-克服“割”忽略数据表中超出范围的值

我正在比较两年的每日土壤湿度(SM)测量值。一年内,SM的范围从0到0.6。 在下雨多的那一年,SM的范围从0到0.8。在这些数据中,我还有一些 NA's ,其中SM传感器由于某种原因无法工作。 让我们重新创建类似的东西: library(data.table) set.seed(24 ) dt1 ..
发布时间:2020-10-15 21:16:38 其他开发