机器学习训练数据不足怎么办?如何有效增加数据?
在文章实战开发的过程中,我们经常会遇到一些这样那样的问题,然后要卡好半天,等问题解决了才发现原来一些细节知识点还是没有掌握好。今天就整理分享《机器学习训练数据不足怎么办?如何有效增加数据?》,聊聊,希望可以帮助到正在努力赚钱的你。
合理增加学习数据
当机器学习训练数据量不足时,如何尽可能合理地增加数据是一个常见的难题。
一种方法是重采样,即直接复制现有数据。此外,过采样可以创建新数据,如 SMOTE 算法和数据增强技术。
然而,需要注意的是,并不是所有数据删除操作都是有益的。例如,将 NUM1 中的一个 A 删除可能不会显着改善数据集,因为重采样也会生成相同的数据。
一个更有效的方法是创建真正的新数据,但要注意以下几点:
- 不要对测试数据造数据。 测试集应使用真实数据。
- 确保造出的数据符合原始数据集的分布。
欲了解更多信息,请参阅有关处理不平衡数据集的博客:https://www.cnblogs.com/wuliytTaotao/p/9308944.html。
文中关于的知识介绍,希望对你的学习有所帮助!若是受益匪浅,那就动动鼠标收藏这篇《机器学习训练数据不足怎么办?如何有效增加数据?》文章吧,也可关注公众号了解相关技术文章。