AI
梯度流与 Wasserstein 梯度流:从山顶滑雪到概率风景线
大家好!今天我们要聊一聊一个有趣的概念,叫做 「梯度流 (Gradient Flow)」 。别紧张,这不是物理课,而 ... 阅读更多
Transformer 升级之路:逆用 Leaky ReRoPE 解决推理成本问题
在上周的文章 《Transformer 升级之路:12 、无限外推的 ReRoPE?》 中,我们介绍了 ReRoPE 和 Le ... 阅读更多
增大 Tokenizer 词表:LLM 续写任务的新挑战与解决方案
语言模型 (LLM) 在自然语言处理中的应用越来越广泛,而通过增大 Tokenizer 的词表来提高压缩率,从而缩短串 ... 阅读更多