logistic-regression相关内容
我正在尝试使用train中的method = "glm"建立分类模型. 当我使用method = "rpart"时,它工作正常,但是当我切换到method = "glm"时,它给我一个错误提示 调整参数网格应具有列参数 我尝试使用 cpGrid = data.frame(.0001) 还 cpGrid = data.frame(expand.grid(.cp = se
..
我正在针对综合数据集在Spark上执行LogisticRegressionWithSGD.我已经使用香草梯度下降法在Matlab上计算了误差,R值为5%.我得到了用于生成y的模型中使用的相似权重.数据集是使用此示例生成的. 尽管我最终可以通过不同的步长调整获得非常接近的错误率,但是各个功能的权重并不相同.实际上,它变化很大.我尝试了LBFGS来产生火花,它能够在几次迭代中正确预测误差和重量.
..
我正在尝试进行接近浅引导的操作,但是我在处理数据类型时遇到了麻烦.这是脚本: library(languageR) data(dative) sub1
..
我有一个简化的逻辑回归,其结果变量有6个级别:10,20,60,70,80,90 test
..
我使用以下代码绘制了一条拟合的逻辑曲线: 数据:L50 str(L50) "data.frame":10磅.的3个变量: $ Length.Class:int 50 60 70 80 90 100 110 120 130 140 $ Total.Ind:int 9 20 18 8 4 4 1 0 1 2 $ Mature.Ind:int 0 0 6 5 3 2
..
我的数据集大小为42542 x 14,我正在尝试构建不同的模型,例如逻辑回归,KNN,RF,决策树,并比较精度. 对于每种型号,我得到的都是高精度,但ROC AUC却很低. 数据包含约85%的目标变量= 1的样本和15%的目标变量0的样本.我尝试采集样本以解决这种不平衡问题,但仍然得出相同的结果. glm的系数如下: glm(formula = loan_status ~
..
我在家庭特征数据集中使用scikit-learn LogisticRegression,并试图了解如何准备自变量. 我创建了二进制虚拟变量来代替分类变量. 例如具有3个可能值DetachedHouse,SemiDetached和Apartment的变量DWELLING_TYPE已替换为3个二进制变量DWELLING_TYPE_DetachedHouse,DWELLING_TYPE_SemiD
..
我想使用插入符号包构建逻辑回归模型. 这是我的代码. library(caret) df
..
这是我用来执行二进制分类的线性分类器,这是代码片段: my_optimizer = tf.train.AdagradOptimizer(learning_rate = learning_rate) my_optimizer = tf.contrib.estimator.clip_gradients_by_norm(my_optimizer,5.0) # Create a linear cla
..
我已经使用glmnet在R中训练了一个弹性网络模型,并希望使用它来根据新数据集进行预测. 但是我在生成矩阵以用作predict()方法中的参数时遇到了麻烦,因为在新数据集中我的某些因子变量(指示合并症的虚拟变量)只有一个级别(合并症)从未被观察到),这意味着我无法使用 model.matrix(RESPONSE〜.,new_data) 因为它给了我(期望的) contras
..
我有一个小型数据集,其中包含4个独立变量(分别称为a,b,c,d)和1个因变量.由于自变量很少,因此我想探索这些变量的所有组合.只能有14个模型(a,b,c,d,a + b,a + c,a + d,b + c,b + d,c + d,a + b + c,a + b + d ,b + c + d,a + b + c + d). 我手动建立所有模型,这很耗时.因此,我想使其自动化. R中有可能吗?
..
我已经使用以下代码在R中进行了逻辑回归: logistic.train.model3
..
我对R相当陌生,并且习惯了非常基本的应用程序. 现在我遇到了需要帮助的问题: 我正在寻找一种有序逻辑回归的集群标准错误(我的估算类似于我已经尝试过 robcov 和 vcovCL ,它们给了我类似的错误消息: meatCL(x,cluster = cluster,type = type,...)中的错误:数量 'cluster'和'estfun()'中的观测值不匹配 u [,ii]中
..
我试图理解Pyspark中从逻辑回归模型生成的输出的概念. 任何人都可以解释由逻辑回归模型生成的rawPrediction字段计算背后的概念吗? 谢谢. 解决方案 在旧版本的Spark中 “原始"预测的含义在算法之间可能会有所不同,但是它直观地给出了对每个可能标签的置信度的度量(其中较大=更可信). 它在以后的版本中不存在,但是您仍然可以在Scala中找到它无论如何,除了不幸
..
我为逻辑回归编写了以下代码,我想使用spark.ml提供的管道API.但是,在尝试打印系数和截距后,它给了我一个错误.另外,我在计算混淆矩阵和其他指标(如精度,召回率)时遇到了麻烦. #Logistic Regression: from pyspark.mllib.linalg import Vectors from pyspark.ml.classification import Logi
..
我想对drc R包中的以下数据进行log-logistic回归拟合,以适应临时性和多样性.但是,我的代码抛出以下错误 Error in Temp:Variety : NA/NaN argument 代码: df2
..
我一直在跟踪有关使用Logistic回归进行情感分析的示例,其中预测结果仅给出1或0分别给出正面或负面的情绪. 我的挑战是我想将给定的用户输入分类为四个类别(非常好,好,平均,差)之一,但是我的预测结果每次都是1或0. 下面是到目前为止我的代码示例 from sklearn.feature_extraction.text import CountVectorizer from v
..
背景:我正在进行一点A/B测试,使用2x2因子(前景的黑色和背景的白色,异色与正常颜色)和 rates
..
我想使用所有可用变量运行逻辑回归的因变量(在我的数据集中为dat$admit),每个回归均具有其自己的自变量与因变量.我想得到的结果是每个回归摘要的列表:coeff,p-value,AUC.使用下面提交的数据集,应该进行3个回归. 这是一个示例数据集(其中admit是逻辑回归因变量): >dat
..
我有一个名为x的数据框.这由2列组成,看起来像这样(712,2): SibSp Parch 731 0 0 230 1 0 627 0 0 831 1 1 391 0 0 ................. 由于需要'自由权重'的逻辑回归,我构建了newX变量,其形状与x数据框
..