精选论文
-
Attention Is All You Need2017
提出了Transformer架构,彻底改变了自然语言处理领域,为后续的大型语言模型奠定了基础。
显示摘要 -
Denoising Diffusion Probabilistic Models2020
系统性地提出了扩散模型的理论框架,成为当前图像生成领域的主流技术之一。
显示摘要 -
BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding2018
提出了BERT模型,通过双向预训练显著提升了多种自然语言理解任务的性能。
显示摘要 -
ImageNet Classification with Deep Convolutional Neural Networks2012
AlexNet的提出标志着深度学习在计算机视觉领域的崛起,为后续的生成模型提供了强大的特征提取能力。
显示摘要