About 108,000 results
Open links in new tab
  1. 一文了解Transformer全貌(图解Transformer)

    Sep 26, 2025 · 网上有关Transformer原理的介绍很多,在本文中我们将尽量模型简化,让普通读者也能轻松理解。 1. Transformer整体结构 在机器翻译中,Transformer可以将一种语言翻译成 …

  2. 如何最简单、通俗地理解Transformer? - 知乎

    Transformer最开始应用于NLP领域的机器翻译任务,但是它的通用性很好,除了NLP领域的其他任务,经过变体,还可以用于视觉领域,如ViT(Vision Transformer)。 这些特点 …

  3. Transformer两大变种:GPT和BERT的差别(易懂版)-2更

    Jul 16, 2025 · Transformer是GPT和BERT的前身。谷歌和OpenAI在自然语言处理技术上的优化,都是基于这个模型。 更多关于的Transformer可以看文章: ChatGPT与Transformer(无公 …

  4. Transformer模型怎么用于regression的问题? - 知乎

    回归问题概述 Transformer模型基础 回归问题中的Transformer架构调整 应用案例 优化与技巧 挑战与改进 1. 回归问题概述 回归问题是监督学习中的一种任务,目标是预测一个连续值。这类问 …

  5. 为什么 2024 年以后 MMDiT 模块成为了大规模文生视频或者文生 …

    而且对于纯transformer架构,文本tokens和图像tokens拼接在一起也是很自然且容易的事情(UNet的图像是2D特征,而文本是1D特征)。 而且,SD3的技术报告中其实也对不同的架构 …

  6. 挑战 Transformer:全新架构 Mamba 详解

    Sep 23, 2025 · 而就在最近,一名为 Mamba 的架构似乎打破了这一局面。 与类似规模的 Transformer 相比, Mamba 具有 5 倍的吞吐量, 而且 Mamba-3B 的效果与两倍于其规模的 …

  7. 为什么Transformer适合做多模态任务? - 知乎

    但是Transformer,特别是ViT (Vision Transformer)出来之后,这个模型壁垒就被打破了,人们发现原来对付图像和文本都可以使用同一个模型,那么处理多模态的任务,就直接使用把两种模态 …

  8. 请问transformer和pytorch是什么关系呢? - 知乎

    Transformer 是一种深度学习基础模型,可以理解为一种算法,而 Pytorch 是一种深度学习框架,不是具体的算法,是用来搭建算法的,可以理解为是一种脚手架。所以Transformer …

  9. transformer和cnn有什么区别? - 知乎

    transformer和CNN有一个区别是transformer是单尺度的算法,而CNN是多尺度的算法。 这是由于来自于NLP的transformer,每个词是具有语义信息的,而在处理图像的CNN中,单个像素往 …

  10. Transformer统治的时代,LSTM模型并没有被代替,LSTM …

    大家说的Transformer效果好,大多数时候指的使用是预训练的Transformer,也就是BERT、XLNET这些预训练模型。 单独用随机参数初始化的Transformer,除了Seq2Seq类模型(生成 …