sampling相关内容

来自具有R中指定概率的分组数据帧的样本

下面,我首先将我的data.frame( d )按两个分类变量分组。首先,通过性别(两级;男/女)。其次,按部门(教育,工业,非政府组织,私人,公共)。然后,我想从每个部门级别进行抽样,并得出以下概率: c(.2,.3,.3,.1,。 1)和性别,并遵循概率 c(.4,.6)。 我正在使用下面的代码来实现我的目标而没有成功?有解决办法吗? 如果我的代码总体上符合我的正确描述,请发表评论 ..
发布时间:2020-10-17 00:10:35 其他开发

随机分配给训练/测试数据集时,将R数据帧中的行分组在一起

我有一个数据框,该数据框由X行的块组成,每个行对应一个单独的人(其中每个人的X可以不同)。我想将这些人随机分配到训练样本,测试样本和验证样本中,但是到目前为止,我还无法获得正确的语法来确保用户的X行中的每一行始终被收集到同一子样本中。 例如,数据可以简化为: 用户功能1 feature2 1“ A”“ B” 1“ L”“ L” 1“ Q”“ B” 1“ D”“ M” ..
发布时间:2020-10-11 20:09:01 其他开发

在python中从大型数据帧中快速采样大量行

我有一个非常大的数据框(大约110万行),我正在尝试对其进行采样. 我有一个要从整个数据框中选择的索引列表(大约70,000个索引). 这是我到目前为止尝试过的方法,但是所有这些方法都花费了太多时间: 方法1-使用熊猫: sample = pandas.read_csv("data.csv", index_col = 0).reset_index() sample = sa ..
发布时间:2020-09-20 20:00:22 Python

Linux中的音频流采样率

我正在尝试使用C/C ++从Linux中的音频麦克风读取和存储样本.使用PCM ioctl,我使用SOUND_PCM_WRITE_RATE ioctl等将设备设置为具有一定的采样率,例如10Khz.设备正确设置,并且在使用"read"进行设置后无法从设备读回. int got = read(itsFd, b.getDataPtr(), b.sizeBytes()); 我遇到的问题是,在设 ..
发布时间:2020-09-14 00:37:11 服务器开发

根据振幅样本创建音频文件

如果我有一个采样幅度为(0-26522)的文本文件,如何从中创建可播放的音频文件? 我回想起对.pcm文件和8位样本进行修补的模糊回忆. 是否有任何软件可以从样本中自动创建音频文件(PCM或其他格式)?我找到了 SoX ,但是即使在查看了文档之后,我仍然无法确定它是否可以做什么我想要,如果可以的话... 解决方案 GUI音频工作站称为 Audacity 让您做到这一点 文 ..
发布时间:2020-09-13 23:27:03 其他开发

模拟联合累积分布函数中的样本?

我有一个联合密度函数,用于两个独立变量X和Y.现在,我想从此分布中采样新的x,y. 我认为我要做的是找到联合累积分布,然后以某种方式抽样.我有点知道如何在一维中执行此操作,但是我发现很难理解如何在二维中执行此操作. 我还使用了matlab函数cumtrapz来找到累积分布函数以上pdf. 请明确一点,我要做的是从该经验分布中采样随机值x,y. 有人可以在这里向我指出正确的方 ..
发布时间:2020-08-13 19:15:24 其他开发

如何以60Hz的频率精确采样数据?

实际上,我使用InvokeRepeating方法每1/x秒调用另一个方法.问题在于,调用和获得的数据之间的延迟精度不佳. 我如何精确地以60Hz的频率采样transform.position. 这是我的代码: public class Recorder : MonoBehaviour { public float samplingRate = 60f; // sample ra ..
发布时间:2020-07-26 03:56:36 C#/.NET

数字音频格式化

我有一个矢量化的wav文件,其值介于-1和1之间,采样率为88,200,采样率为44.1 kHz,可以在两秒钟内听到音频.我想通过蓝牙将音频发送到蓝牙模块,arduino,DAC和带耳塞的3.5毫米分线板. 最后收到声音时,我会得到清晰的声音.我尝试重新创建这是MATLAB,结果证明是缩放(乘以+将值移至0以上)和由于接收器引起的采样率变化的组合.当然,我可以完全通过效率低下的Arduino ..

随机采样数组的唯一子集

如果我有一个数组: a = [1,2,3] 如何随机选择数组的子集,以使每个子集的元素都是唯一的?也就是说,对于a,可能的子集为: [] [1] [2] [3] [1,2] [2,3] [1,2,3] 我无法生成所有可能的子集,因为a的实际大小非常大,因此有很多子集.目前,我正在使用“随机漫步"的想法-对于a的每个元素,我都会“翻转硬币",并在硬币正面朝上时将其包括在内-但我不 ..
发布时间:2020-07-04 02:40:15 其他开发

R中置信区间的仿真

我有一个R函数,可为t分布的 ncp (非中心参数)提供95%的置信区间. 通过R中的仿真,有可能表明,从长远来看,该R函数的CI会捕获给定的 TRUE ncp (此处的"2"与输入 t )95%的时间? (感谢您对如何执行此操作的任何想法) CI.ncp ..
发布时间:2020-07-04 02:21:17 其他开发

使用python进行拉丁超立方体采样

我想对一个函数定义的分布进行多维(2、3、4)采样: f(x, y, ...) = ... 分布可能是丑陋的,非标准的(例如数据上的3D样条曲线,高斯之和等).为此,我想对2..4维空间进行均匀采样,然后使用一个额外的随机数来接受或拒绝该空间的给定点进入我的样本. 是否已准备好为此目的使用python lib? 是否存在python lib来通过拉丁超立方体采样或其他统一采样 ..
发布时间:2020-07-04 02:01:19 Python

在R中将rnorm作为另一个rnorm的参数是什么意思?

我很难理解将rnorm用作另一个rnorm的参数之一是什么意思? (我将在下面详细说明) 例如,在下面的R代码的第一行中,我使用rnorm(),并将其称为rnorm():mu. mu由10,000个x组成. 现在,让我将mu本身作为新的rnorm()的mean自变量,称为“分发". 我的问题是,如何将本身具有10,000个x的mu用作这个称为分发的新rnorm()的mean ..
发布时间:2020-07-04 01:53:45 其他开发

使用R每天随机分配参与者参加治疗

问题: 我正在尝试使用R生成随机研究设计,其中一半的参与者被随机分配给“治疗1",另一半的参与者被分配给“治疗2".但是,由于一半的受试者是男性,一半的受试者是女性,我还想确保每次治疗都接受相同数量的男性和女性,因此,应该将一半的男性和女性分配给“治疗1",其余的一半应分配给“处理2". 此设计有两个并发症:(1)这项为期一年的研究,必须每天对参与者进行治疗; (2)每位参与者必须在2 ..
发布时间:2020-07-04 01:36:38 其他开发