我怎么知道训练数据足以进行机器学习 [英] How can I know training data is enough for machine learning

查看:88
本文介绍了我怎么知道训练数据足以进行机器学习的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

例如:如果我想训练一个分类器(也许是SVM),我需要收集多少个样本?有没有一种测量方法?

For example: If I want to train a classifier (maybe SVM), how many sample do I need to collect? Is there a measure method for this?

推荐答案

要知道需要收集多少样本并不容易.但是,您可以按照以下步骤操作:

It is not easy to know how many samples you need to collect. However you can follow these steps:

用于解决典型的ML问题:

For solving a typical ML problem:

  1. 用几个样本构建一个数据集a,多少个样本?这取决于您所遇到的问题,现在不要花很多时间.
  2. 将您的数据集拆分为训练,交叉,测试和构建模型.
  3. 现在,您已经建立了ML模型,您需要评估它的质量.计算您的测试错误
  4. 如果您的测试错误低于预期,请收集新数据并重复步骤1-3,直到达到您满意的测试错误率.

如果您的模型没有遭受高偏差",则此方法将起作用.

This method will work if your model is not suffering "high bias".

来自Coursera的机器学习课程的视频对此进行了解释.

这篇关于我怎么知道训练数据足以进行机器学习的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆