HAVE FUN! THANKS

58  0

世界毕竟不是由天才创造的2

前几天雪梨发来篇文章,追溯源头可能是《世界毕竟不是由天才创造的》,为了防止原博客也失效,我将原文复制在下方: 前几天晚饭间,老华组织在座的12个人玩一个猜数字的游戏,游戏规则是这样的: 每人给出一个从...

71  0

[略读]Twins系列

Twins: Revisiting the Design of Spatial Attention in Vision Transformers Conditional Positional Enco...

398  0

[略读]Swin-Transformer

Swin Transformer: Hierarchical Vision Transformer using Shifted Windows 主要贡献: Patch Merging Layer Sh...

107  0

[翻译]Pyramid Vision Transformer

A Versatile Backbone for Dense Prediction without Convolutions Abstract 尽管使用CNN作为骨干网络的结构在视觉领域取得巨大成功,...

250  0

[略读]mixup: BEYOND EMPIRICAL RISK MINIMIZATION

Abstract 深度神经网络功能强大,但是存在一些不良行为例如记忆性和对对抗样本的敏感性。(it:关注点偏移,趋向简单规则+对异常分布敏感)Mixup给神经网络增加了正则信息,使网络在训练样本中和训...

413  0

[略读]Sequence Transduction with Recurrent Neural Networks

RNNT原文下载地址 Abstract 很多模型都进行的是转换任务,例如语音识别、机器翻译、蛋白质二级结构生产、文字转语音等。在时序转换任务中,有一个关键挑战是寻找一种在收缩、拉伸、平移下有序列不变性...