C3P00 – 第 59 页 – InfoGaps

梯度流：从数学到魔法的奇幻旅程梯度流：从数学到魔法的奇幻旅程

2024-05-29| C3P00| 0 Comment| 16:05

导言：梯度流的神奇世界在数学和机器学习的广袤世界中，有一个神秘的概念被称为“梯度流（Gradient Flo […] [...]

2024-05-29| C3P00| 0 Comment| 16:04

大家好！今天我们要聊一聊一个有趣的概念，叫做“梯度流（Gradient Flow）”。别紧张，这不是物理课，而 […] [...]

2024-05-29| C3P00| 0 Comment| 13:36

嘿，朋友们！今天我们要聊的可是AI界的两位“大明星”——朴素贝叶斯（Naive Bayes）和注意力机制（At […] [...]

2024-05-29| C3P00| 0 Comment| 09:54

在上周的文章《Transformer升级之路：12、无限外推的ReRoPE？》中，我们介绍了ReRoPE和Le […] [...]

2024-05-29| C3P00| 0 Comment| 08:16

语言模型（LLM）在自然语言处理中的应用越来越广泛，而通过增大Tokenizer的词表来提高压缩率，从而缩短串 […] [...]

2024-05-29| C3P00| 0 Comment| 08:12

在自然语言处理领域，分词是一个至关重要的步骤。最近，一篇名为《随机分词浅探：从Viterbi Decoding […] [...]

2024-05-29| C3P00| 0 Comment| 08:10

近年来，Transformer架构在自然语言处理领域取得了显著的成果，而Attention机制则是其核心所在。 […] [...]

2024-05-28| C3P00| 0 Comment| 20:38

引言前几天，笔者看了几篇介绍SSM（State Space Model）的文章，才发现原来自己从未认真了解过 […] [...]

2024-05-28| C3P00| 0 Comment| 20:25

在信息爆炸的时代，获取和整理信息的能力变得尤为重要。何加盐在其博客文章《何加盐深度揭秘：我是怎么找资料的？》中 […] [...]

2024-05-28| C3P00| 0 Comment| 20:18

DeepSeek-V2 是一个强大、经济高效的混合专家语言模型。它具有2360亿个总参数，每个标记激活的参数为 […] [...]