vowpalwabbit相关内容

使用 Vowpal Wabbit 时计算 AUC

无论如何可以在 Vowpal Wabbit 中计算 AUC 吗? 我使用 Vowpal Wabbit 的原因之一是数据文件很大.我可以使用 Vowpal Wabbit 的输出计算 Vowpal Wabbit 环境之外的 AUC,但如果数据文件很大,这可能会出现问题. 解决方案 目前,大众无法报告 AUC.更糟糕的是,它不能直接针对 AUC 进行优化.优化 AUC 与在线学习不兼容,但 ..
发布时间:2021-12-14 09:57:47 AI人工智能

与 Vowpal Wabbit Contextual Bandit 训练数据格式的混淆

我是 Vowpal Wabbit 的新手,正在研究多臂老虎机模型,为注册弹出窗口推荐不同的 CTA.我已经在主站点上完成了演练,但是对于 --cb_explore_adf 版本的训练数据应该是什么样子,我有点困惑.到目前为止,对于常规版本(带有设置的操作总数),数据如下所示: action:cost:probability |特征 这是有道理的,但是当你使用 adf 版本时,它变成了: |a ..
发布时间:2021-07-07 18:57:00 其他开发

Vowpal Wabbit:处于--daemon模式时,获取可读模型

我正在尝试以--daemon模式将数据流传输到vw,并希望最后获得每个变量的系数值. 因此,我希望vda在--daemon模式下执行以下任一操作: -给我发回我发送的每一行数据的系数的当前值. -以“-可读模型"格式编写结果模型. 我知道关于虚拟示例技巧save_namemodel | ...,该技巧可以将vw设为守护程序模式以将模型保存到给定的文件中,但这还不够,因为我无法访问该文件中的系 ..
发布时间:2020-07-14 00:50:32 其他开发

如何在vowpal wabbit中重新训练文件序列模型

我正在尝试对一组文件(截至目前大约10个)运行vowpal wabbit.我的实验如下: 将第一个火车文件转换为VW格式 使用第一个训练文件训练大众汽车模型​​并存储模型. 使用存储的模型验证测试文件的准确性 现在获取第二个文件,将其转换为VW格式,并使用第二个文件重新训练步骤2中存储的模型,并存储更新的模型 在重新训练的模型上验证测试文件并报告准确性. 使用f ..
发布时间:2020-07-14 00:49:27 其他开发

解释Vowpal Wabbit的基本输出

我对简单的大众汽车的输出有几个疑问.我已经阅读了互联网和Wiki网站,但是仍然不确定一些基本知识. 我对波士顿住房数据进行了以下操作: vw -d housing.vm --progress 1 其中的housing.vm文件设置为(部分): 和输出(部分): 问题1: 1)按照以下步骤考虑平均损失列是否正确: a)预测为零,因此第一个平均损失是第一个示例的 ..
发布时间:2020-07-14 00:49:21 其他开发

如何使用vowpal wabbit进行在线预测(流模式)

我正在尝试将Vowpal Wabbit用于具有154种不同类别标签的一项多类别分类任务,如下所示: 训练有素的大众模型,包含大量数据. 使用一个专用测试集测试了模型. 在这种情况下,我能够达到> 80%的结果,这很好.但是我目前正在研究的问题是: 我必须复制实时预测方案.在这种情况下,我必须一次传递一个数据点(即文本行),以便模型可以预测值和输出. 我尝试了所有我知道但失 ..
发布时间:2020-07-14 00:49:08 其他开发

适用于Vowpal Wabbit的Java API?

我正在尝试通过Java使用 Vowpal Wabbit .我已经从GitHub下载并成功编译了代码.命令行工具可以正常工作. 快速浏览存储库(尤其是此处)之后,我只能假设已经可以通过Java使用它了,而我真的不想重新发明轮子. 围绕Vowpal Wabbit的包装器,允许通过Java使用.该包装器设计为自包含的.因为 关于JNI的使用,此JAR支持许多平台. 我已经添加了Maven依赖 ..
发布时间:2020-07-14 00:49:00 Java开发

如何在真正的在线模式下演示Vowpal Wabbit的上下文强盗?

根据可用的文档和资源,还不清楚如何完成一个简单的入门流程,在该流程中,您将Vowpal Wabbit作为守护程序启动(甚至可能没有任何预学习模型)并使其在线学习和使用.探索―我正在寻找在上下文中提供反馈,获得建议并反馈成本/报酬的流程. 因此,让我跳过对尝试过的技术的描述,仅要求就我认为在这方面必不可少的内容进行清晰的演示- 如何通过守护程序演示正在进行的学习,而不是从批处理数据以脱机 ..
发布时间:2020-07-14 00:48:57 其他开发

--oaa 2和--loss_function = logistic在Vowpal Wabbit中的作用

对于二进制分类任务,我应该在大众汽车中使用哪些参数?例如,让我们使用 rcv1_small.dat .我认为更好使用逻辑损失函数(或铰链),而使用--oaa 2没有任何意义.但是,经验结果(在所有4个实验中均报告了渐进验证0/1损失)表明,最佳组合是--oaa 2而没有逻辑损失(即具有默认平方损失): cd vowpal_wabbit/test/train-sets cat rcv1_sm ..
发布时间:2020-07-14 00:48:53 其他开发

--pass在Python VowpalWabbit中有什么作用?

-passes标志是训练通过的次数.但是,尚不清楚通过概念在训练Python VW模型(例如在for循环内)时意味着什么. 例如如果我正在像这样的for循环中训练一个示例的示例,则该示例: for line in train: model.learn(line) 如果每个训练样本仅从中学习一次,怎么会有多次通过? 解决方案 在Python中,passes选项仅在使用 ..
发布时间:2020-05-10 19:01:03 其他开发

Vowpal Wabbit多类别分类预测概率

我正在尝试用Vowpal Wabbit做多个分类问题. 我有一个火车文件,看起来像这样: 1 | feature_space 2 | feature_space 3 | feature_space 作为输出,我想获得属于每个类的测试项目的概率,如下所示: 1:0.13 2:0.57 3:0.30 例如,思考sklearn分类器的predict_proba方 ..
发布时间:2020-05-04 10:14:56 AI人工智能

Vowpal Wabbit中带有vw-hypersearch的多维超参数搜索

vw-hypersearch 是Vowpal Wabbit包装器,用于在大众汽车模型​​中优化超参数:正则化率,学习率和衰减,小批量,自举大小等.在教程有以下示例: vw-hypersearch 1e-10 5e-4 vw --l1 % train.dat 此处%表示要优化的参数,1e-10 5e-4是要搜索的时间间隔的上限和下限.该库使用黄金分割搜索方法来最大程度地减少迭代次 ..
发布时间:2020-05-04 09:49:53 AI人工智能

Vowpal Wabbit的梯度提升

是否有办法在使用Vowpal Wabbit进行回归分析时使用梯度增强?我使用Vowpal Wabbit随附的各种有用的技术.我想同时尝试梯度增强,但是我找不到在大众汽车上实现梯度增强的方法. 解决方案 梯度增强的想法是一个整体模型是根据黑匣子弱模型构建的.您当然可以将VW用作黑匣子,但请注意,VW不提供决策树,而决策树是黑匣子弱势模型在提升方面的最受欢迎选择.一般而言,提升可以降低偏差(并 ..
发布时间:2020-05-04 09:13:28 AI人工智能

使用Vowpal Wabbit时计算AUC

反正是在Vowpal Wabbit中计算AUC吗? 我使用Vowpal Wabbit的原因之一是数据文件很大. 我可以使用Vowpal Wabbit的输出在Vowpal Wabbit环境之外计算AUC,但是如果数据文件很大,这可能会出现问题. 解决方案 当前,大众汽车无法报告 AUC .更糟糕的是,它无法直接针对AUC进行优化.针对AUC进行优化与在线学习不兼容,但是有一些适合进行优 ..
发布时间:2020-05-04 08:57:20 AI人工智能