zha8035的个人博客分享 http://blog.sciencenet.cn/u/zha8035

博文

fast.ai

已有 1251 次阅读 2021-5-10 09:44 |个人分类:医学图像|系统分类:科研笔记

在读fastai 的配套书籍,有几点更加清楚了。第一章,validation sets and test sets, 全书10%左右位置

1)为何要有 test 数据集,在有了training 和 validation dataset 之后?

主要是你在手工选择model或超参数时,其实用了validation 数据,所以最终model已经间接使用了validationdata里面的信息。

2)如何选取test 数据?

对于 时间序列,随机选取不好,而是要选取一段前面的,训练,测试则用后面的。随机选太容易通过差值就算出来了。

对于 走神的司机那个数据集,你要注意测试集是之前训练集完全没看到过的新面孔,否则系统容易偷懒,记住面孔就可以了。

一些新单词 bluntly entrant hedge dumb curated conundrum 



https://blog.sciencenet.cn/blog-210707-1285815.html

上一篇:如何看李笑来作品
下一篇:“得到”5周年生日 罗胖分享 5 26 2021
收藏 IP: 211.83.110.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-16 21:42

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部