BYOL论文笔记(Bootstrap Your Own Latent A New Approach to Self-Supervised Learning)

BYOL论文笔记(Bootstrap Your Own Latent A New Approach to Self-Supervised Learning)

一、基本架构

在这里插入图片描述

在这里插入图片描述

二、BYOL实现细节

数据增强:使用在SimCLR中同样的一系列数据增强,包括随机水平翻转、颜色扰动、高斯模糊等。
网络架构:使用resnet50、resnet50(1x)作为基本的编码器,使用两层的MLP作为online和target网络的投影器(2048-4096,4096-256),预测层和投影层使用同样的结构。
优化:使用Lars优化器,1000epoches, batch size of 4096, 使用 512 Cloud TPU v3 cores

三、评估和消融实验

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

四、总结:

通过减小正例之间的距离,扩大负例之间距离的对比学习方法大多依赖大的batch size、内存或者特定的负例挖掘策略,它们的效果也取决于数据增强方式和种类的选择。
这篇文章认为不依赖负例是它具有较高鲁棒性的首要原因。使用BYOL方法,更小的batchsize和更少的数据增强类型相对于SimCLR来说精度下降的更少一些。
可利用:
官方github提供resnet50_1x的预训练模型(tensorflow版本)以及Batchsize=2048、1024、512、256、128、64的checkpoint
solo-learn提供了相关的方法和类

相关文章

前端工程师一般用的是Bootstrap的框架而不是样式,样式一般自...
起步导入:<linkrel="stylesheet"href="b...
(1)modal声明一个模态框(2)modal-dialog定义模态框尺寸(...
图片在Bootstrap版本3中,通过为图片添加 .img-responsive ...
<inputtype="text"class="form-controlda...
目录bootstrap-treeview使用小记零、写在前面的话一、功能说...