microsoft-r相关内容

拆分XDF文件/数据集以进行培训和测试

是否可以在Microsoft RevoScaleR上下文中将.xdf文件拆分为75%的培训和25%的测试集?我知道有一个名为rxSplit()的函数,但是文档似乎不适用于这种情况.在线上的大多数示例都为数据集分配一列随机数,然后使用该列对其进行拆分. 谢谢. 托马斯 解决方案 您当然可以使用rxSplit.创建一个定义您的训练和测试样本的变量,然后对其进行拆分. 例如,使用mt ..
发布时间:2020-06-30 21:47:49 其他开发

在协方差矩阵上计算SVD时的奇怪行为:Microsoft R和Vanilla R之间的结果不同

当我得到一些奇怪的结果时,我正在对运行Microsoft R 3.3.0的Macbook进行一些主成分分析.经过与同事的双重检查,我已经意识到SVD函数的输出与使用Vanilla R可能获得的输出有所不同. 这是可重复的结果,请在此处使用Microsoft R 3.3.0(x86_64-apple-darwin14.5.0),我得到: >> sv > print ..
发布时间:2020-06-30 21:47:45 其他开发

Microsoft R Server逐行插入

我有一个for循环,通常将其写入平面文件.这样,如果发生任何问题,我可以从中断的地方开始.我想将此过程转换为使用执行R代码的SQL Server 2016存储过程中的新RevoScaleR函数直接从SQL表读取和写入. 这是一个简单的SPROC: USE [master] GO /****** Object: StoredProcedure [dbo].[Rscript_geoco ..
发布时间:2020-06-30 21:47:41 数据库

替换MSR中的existng列

为什么以下MSR代码不能替换原始列"Var1"? rxDataStep(inData = input_xdf, outFile = input_xdf, overwrite = TRUE, transforms = list(Var1 = as.numeric(Var1)), transformVars = c("Var1") ) 解决方案 目 ..
发布时间:2020-06-30 21:47:36 其他开发

lme()不同的结果各自在Revolution R下运行(应归咎于MKL吗?)

更新(2014年8月):我从来没有深入了解这一点,也从未在Revolution的论坛上得到任何反馈.但是,该问题似乎已在Revolution R 7.2(R 3.0.3,又是学术版本)中得到修复.我将lme()测试运行了几百次,都按预期产生了相等的结果.[更新结束] 我刚刚在新PC上安装了Revolution R 7.0(R 3.0.2)的学术版,并且下面的代码得到了奇怪的结果.每次运行代码 ..
发布时间:2020-06-30 21:46:20 其他开发

将rxGlm转换为GLM时出错

我在将rxGlm模型转换为普通glm模型时遇到问题.每次尝试隐藏模型时,都会出现相同的错误: Error in qr.lm(object) : lm object does not have a proper 'qr' component. Rank zero or should not have used lm(.., qr=FALSE). 这是一个简单的例子: cols ..
发布时间:2020-06-30 21:46:15 其他开发

带R的SQL 2016-错误HRESULT 0x80004004

我正在研究许多有关使用SQL和R的教程.但是,当我尝试运行R脚本以获取"ggplot"库时,出现以下错误 Msg 39004, Level 16, State 20, Line 1 A 'R' script error occurred during execution of 'sp_execute_external_script' with HRESULT 0x80004004. Msg ..
发布时间:2020-06-30 21:46:13 其他开发

如何绘制来自非常大的数据集(尤其是来自rxGlm输出)的交互作用

我正在计算glm模型是基于一个巨大的数据数据集. glm甚至speedglm都需要花费几天的时间来计算. 我目前有大约3M个观测值和总共400个变量,其中只有一些用于回归.在回归分析中,我使用4个整数自变量(iv1,iv2,iv3,iv4),1个二进制自变量作为因子(iv5),交互项(x * y,其中是整数,而y是二进制虚拟变量作为因子).最后,我对ff1年和公司ID ff2都有固定的影响. ..
发布时间:2020-06-30 21:46:02 其他开发

将数据帧传递给MS R Server模型操作

我正在运行ML服务器,并且已部署了一项服务,希望该服务的输入之一是data.frame。 当我使用mrsdeploy与R连接到该API端点时,可以传递data.frame。我想使用json在prostman中做同样的事情。 如何格式化我的json,让我们说出某人的特征输入(data.frame)? 我会假设它像 { ... “ bio”:{“ age”:23,“ heigh ..
发布时间:2020-05-30 02:19:25 其他开发

在Microsoft R Open中将取决于RcppEigen的R程序包与MKL链接

我用一些用RcppEigen编写的功能构建了一个自定义程序包.我还启用了Microsoft MKL并打开了MicrosoftR.如何将R软件包链接到英特尔MKL功能? 设置1 : 以下是我尝试将程序包与普通R中的MKL链接但失败的过程: 本征文档说我需要: 1. #define EIGEN_USE_MKL_ALL 2. link your program to MKL li ..
发布时间:2020-05-23 19:37:05 其他开发

R中的大型固定效应二项式回归

我需要在具有480.000个条目和3个固定效果变量的相对较大的数据帧上进行逻辑回归.固定效果var A具有3233级,var B具有2326级,var C具有811级.因此,我总共有6370个固定效果.数据是横截面的.如果由于回归矩阵对于我的内存而言似乎太大而无法使用常规的glm函数运行此回归(我收到消息"Error: cannot allocate vector of size 22.9 Gb" ..