vowpalwabbit相关内容
无论如何可以在 Vowpal Wabbit 中计算 AUC 吗? 我使用 Vowpal Wabbit 的原因之一是数据文件很大.我可以使用 Vowpal Wabbit 的输出计算 Vowpal Wabbit 环境之外的 AUC,但如果数据文件很大,这可能会出现问题. 解决方案 目前,大众无法报告 AUC.更糟糕的是,它不能直接针对 AUC 进行优化.优化 AUC 与在线学习不兼容,但
..
我是 Vowpal Wabbit 的新手,正在研究多臂老虎机模型,为注册弹出窗口推荐不同的 CTA.我已经在主站点上完成了演练,但是对于 --cb_explore_adf 版本的训练数据应该是什么样子,我有点困惑.到目前为止,对于常规版本(带有设置的操作总数),数据如下所示: action:cost:probability |特征 这是有道理的,但是当你使用 adf 版本时,它变成了: |a
..
我是典型的常规R用户.在 R 中有非常有用的 lda.collapsed.gibbs.sampler 在
..
我正在尝试以--daemon模式将数据流传输到vw,并希望最后获得每个变量的系数值. 因此,我希望vda在--daemon模式下执行以下任一操作: -给我发回我发送的每一行数据的系数的当前值. -以“-可读模型"格式编写结果模型. 我知道关于虚拟示例技巧save_namemodel | ...,该技巧可以将vw设为守护程序模式以将模型保存到给定的文件中,但这还不够,因为我无法访问该文件中的系
..
我正在尝试对一组文件(截至目前大约10个)运行vowpal wabbit.我的实验如下: 将第一个火车文件转换为VW格式 使用第一个训练文件训练大众汽车模型并存储模型. 使用存储的模型验证测试文件的准确性 现在获取第二个文件,将其转换为VW格式,并使用第二个文件重新训练步骤2中存储的模型,并存储更新的模型 在重新训练的模型上验证测试文件并报告准确性. 使用f
..
我对简单的大众汽车的输出有几个疑问.我已经阅读了互联网和Wiki网站,但是仍然不确定一些基本知识. 我对波士顿住房数据进行了以下操作: vw -d housing.vm --progress 1 其中的housing.vm文件设置为(部分): 和输出(部分): 问题1: 1)按照以下步骤考虑平均损失列是否正确: a)预测为零,因此第一个平均损失是第一个示例的
..
下面是训练我的大众模型的日志的一部分. 为什么这些行中的某些后跟h?您会注意到最后总结中的“平均损失"行是正确的.我不确定这是什么意思,还是我应该在意. ... average since example example current current current loss last counter
..
我正在尝试将Vowpal Wabbit用于具有154种不同类别标签的一项多类别分类任务,如下所示: 训练有素的大众模型,包含大量数据. 使用一个专用测试集测试了模型. 在这种情况下,我能够达到> 80%的结果,这很好.但是我目前正在研究的问题是: 我必须复制实时预测方案.在这种情况下,我必须一次传递一个数据点(即文本行),以便模型可以预测值和输出. 我尝试了所有我知道但失
..
给定一个训练有素的上下文盗贼模型,我该如何检索测试样本上的预测向量? 例如,假设我有一个名为"train.dat"的火车,其中包含以下格式的行 1:-1:0.3 | a b c # 2:2:0.3 | a d d 3:-1:0.3 | a b e .... 我在命令下运行. vw -d train
..
我正在尝试通过Java使用 Vowpal Wabbit .我已经从GitHub下载并成功编译了代码.命令行工具可以正常工作. 快速浏览存储库(尤其是此处)之后,我只能假设已经可以通过Java使用它了,而我真的不想重新发明轮子. 围绕Vowpal Wabbit的包装器,允许通过Java使用.该包装器设计为自包含的.因为 关于JNI的使用,此JAR支持许多平台. 我已经添加了Maven依赖
..
根据可用的文档和资源,还不清楚如何完成一个简单的入门流程,在该流程中,您将Vowpal Wabbit作为守护程序启动(甚至可能没有任何预学习模型)并使其在线学习和使用.探索―我正在寻找在上下文中提供反馈,获得建议并反馈成本/报酬的流程. 因此,让我跳过对尝试过的技术的描述,仅要求就我认为在这方面必不可少的内容进行清晰的演示- 如何通过守护程序演示正在进行的学习,而不是从批处理数据以脱机
..
对于二进制分类任务,我应该在大众汽车中使用哪些参数?例如,让我们使用 rcv1_small.dat .我认为更好使用逻辑损失函数(或铰链),而使用--oaa 2没有任何意义.但是,经验结果(在所有4个实验中均报告了渐进验证0/1损失)表明,最佳组合是--oaa 2而没有逻辑损失(即具有默认平方损失): cd vowpal_wabbit/test/train-sets cat rcv1_sm
..
我有以下所有类别变量的数据: class education income social_standing 1 basic low good 0 low high V_good 1 high low not_good 0
..
我在Windows 10上安装了python 3.7.0,但无法安装Vowpalwobbit.当我使用命令时: pip install vowpalwabbit 我得到: Building wheels for collected packages: vowpalwabbit Building wheel for vowpalwabbit (setup.py) ... erro
..
-passes标志是训练通过的次数.但是,尚不清楚通过概念在训练Python VW模型(例如在for循环内)时意味着什么. 例如如果我正在像这样的for循环中训练一个示例的示例,则该示例: for line in train: model.learn(line) 如果每个训练样本仅从中学习一次,怎么会有多次通过? 解决方案 在Python中,passes选项仅在使用
..
我正在尝试用Vowpal Wabbit做多个分类问题. 我有一个火车文件,看起来像这样: 1 | feature_space 2 | feature_space 3 | feature_space 作为输出,我想获得属于每个类的测试项目的概率,如下所示: 1:0.13 2:0.57 3:0.30 例如,思考sklearn分类器的predict_proba方
..
在大小为78的密集特征向量上,我有3113个训练示例.特征的大小不同:大约20个,大约200K.例如,这是训练示例之一,以vowpal-wabbit输入格式. 0.050000 1 '2006-07-10_00:00:00_0.050000| F0:9.670000 F1:0.130000 F2:0.320000 F3:0.570000 F4:9.837000 F5:9.593000 F6:
..
vw-hypersearch 是Vowpal Wabbit包装器,用于在大众汽车模型中优化超参数:正则化率,学习率和衰减,小批量,自举大小等.在教程有以下示例: vw-hypersearch 1e-10 5e-4 vw --l1 % train.dat 此处%表示要优化的参数,1e-10 5e-4是要搜索的时间间隔的上限和下限.该库使用黄金分割搜索方法来最大程度地减少迭代次
..
是否有办法在使用Vowpal Wabbit进行回归分析时使用梯度增强?我使用Vowpal Wabbit随附的各种有用的技术.我想同时尝试梯度增强,但是我找不到在大众汽车上实现梯度增强的方法. 解决方案 梯度增强的想法是一个整体模型是根据黑匣子弱模型构建的.您当然可以将VW用作黑匣子,但请注意,VW不提供决策树,而决策树是黑匣子弱势模型在提升方面的最受欢迎选择.一般而言,提升可以降低偏差(并
..
反正是在Vowpal Wabbit中计算AUC吗? 我使用Vowpal Wabbit的原因之一是数据文件很大. 我可以使用Vowpal Wabbit的输出在Vowpal Wabbit环境之外计算AUC,但是如果数据文件很大,这可能会出现问题. 解决方案 当前,大众汽车无法报告 AUC .更糟糕的是,它无法直接针对AUC进行优化.针对AUC进行优化与在线学习不兼容,但是有一些适合进行优
..