Paddle 大家对数据清洗有没有什么好的方法?

发布于 2021-03-01 21:11:55

大家对数据清洗有没有什么好的方法,比如官网的十二生肖数据集(Zodiac),存在一些无法读取的图片。
我的方式是逐个读取出来,然后测试 img.shape,坏文件无法赋值,就写入bad_list,或者删除。
但是逐个读取,速度有点慢。
image.png

查看更多

关注者
0
被浏览
137
GT
GT 2021-03-01

我可能会考虑多进程,如果CPU没吃满的话(我也是一个一个来的)

1 个回答

撰写答案

请登录后再发布答案,点击登录

发布
问题

分享
好友

手机
浏览

扫码手机浏览