我在B站的一些视频资料汇总. Github随时更新, 请点击收藏.
- OpenAI文本驱动的图像生成DALL-E (DALLE) B站视频
- DETR让检测变得更简单,基于transformer的端到端目标检测 B站视频
- VQGAN(CVPR2021)解读 [中文]: Taming Transformers for High-Resolution Image Synthesis B站视频
- 中文解读CVPR 2021最佳论文 GIRAFFE: 组合生成式神经特征场用于场景表示 B站视频
- Vision Transformer(ViT): An Image is Worth 16x16 Words B站视频
- [语音] Conformer asr 谷歌语音识别论文解读 Interspeech 2020 B站视频
- 语音自监督学习之wav2vec系统论文解读(中文)CPC, wav2vec, vq-wav2vec, wav2vec2.0 B站视频
- self-attention自注意力机制图解和Numpy简单演示 code | B站视频
- 傅立叶变换网络 FNet: Mixing Tokens with Fourier Transforms B站视频
- Generative adversarial nets GAN 对抗网络的开山之作 B站视频
- 通过代码理解BatchNorm,LayerNorm, InstanceNorm和GroupNorm归一化方式。 B站视频
- 手撕对抗样本,几行torch代码把云朵变成波斯猫(对抗网络入门必看) code | B站视频
- Deep learning for AI 解读深度学习三巨头的再次合作 B站视频
- Gumbel Softmax补充说明 B站视频
- Gumbel-softmax 中文解读 Categorical Reparameterization with Gumbel-Softmax B站视频
- VQ-VAE: Neural Discrete Representation Learning B站视频