跳至内容

InfoGaps | 信息差

  • Forum
  • Friends
  • Join
  • About

C3P00

梯度流:从数学到魔法的奇幻旅程

2024-05-29 作者 C3P00

导言:梯度流的神奇世界 在数学和机器学习的广袤世界中,有一个神秘的概念被称为 「梯度流 (Gradient Flo ... 阅读更多

分类 AI 发表评论

梯度流与 Wasserstein 梯度流:从山顶滑雪到概率风景线

2024-05-29 作者 C3P00

大家好!今天我们要聊一聊一个有趣的概念,叫做 「梯度流 (Gradient Flow)」 。别紧张,这不是物理课,而 ... 阅读更多

分类 AI 发表评论

朴素贝叶斯与注意力机制:一场 「心有灵犀」 的邂逅

2024-05-29 作者 C3P00

嘿,朋友们!今天我们要聊的可是 AI 界的两位 「大明星」——朴素贝叶斯 (Naive Bayes) 和注意力机制 (At ... 阅读更多

分类 AI 发表评论

Transformer 升级之路:逆用 Leaky ReRoPE 解决推理成本问题

2024-05-29 作者 C3P00

在上周的文章 《Transformer 升级之路:12 、无限外推的 ReRoPE?》 中,我们介绍了 ReRoPE 和 Le ... 阅读更多

分类 AI 发表评论

增大 Tokenizer 词表:LLM 续写任务的新挑战与解决方案

2024-05-29 作者 C3P00

语言模型 (LLM) 在自然语言处理中的应用越来越广泛,而通过增大 Tokenizer 的词表来提高压缩率,从而缩短串 ... 阅读更多

分类 AI 发表评论

Viterbi Sampling 算法的改进与完善

2024-05-29 作者 C3P00
分类 AI 发表评论

探索线性 Attention 的局限性:从 「集中注意力」 角度出发

2024-05-29 作者 C3P00

近年来,Transformer 架构在自然语言处理领域取得了显著的成果,而 Attention 机制则是其核心所在。 ... 阅读更多

分类 AI 发表评论

深度学习中的状态空间模型 (SSM) 初探

2024-05-28 作者 C3P00

引言 前几天,笔者看了几篇介绍 SSM(State Space Model) 的文章,才发现原来自己从未认真了解过 ... 阅读更多

分类 AI 发表评论

何加盐深度揭秘:我是怎么找资料的?

2024-05-28 作者 C3P00

在信息爆炸的时代,获取和整理信息的能力变得尤为重要。何加盐在其博客文章 《何加盐深度揭秘:我是怎么找资料的?》 中 ... 阅读更多

分类 信息差 发表评论

DeepSeek-V2 大模型

2024-05-28 作者 C3P00
分类 AI 发表评论
较早文章
较新文章
← 上一页 页面 1 … 页面 58 页面 59 页面 60 … 页面 116 下一页 →

Recent Posts

  • 🌌 从打工到自由:赚钱效率的系统博弈
  • 香烟的秘密契约:从一根烟到国家货币的稳定之谜
  • 🌍 从 「知识分子」 到 「公知」:词语的漂移之旅
  • 🌌 从书斋到世界:知识分子为何易被欧美 「渗透」?
  • 哟西!宗桑!请在这里坐,你滴红点点我滴已经大大滴贴好了!

Recent Comments

  1. admin 发表在 PHP 8.3 @ Ubuntu 无法开启 JIT 的问题
  2. C3P00 发表在 RWKV-5 详细解析:理解并行训练的 RNN 网络
  3. C3P00 发表在 【重磅】 从 RAG 到 Self-RAG:LLM 的知识增强
  4. C3P00 发表在 🔑 密码的终结者:WebAuthn API 深度解析
  5. C3P00 发表在 英特尔重拳出击:全新"纯大核"处理器或将改变市场格局
© 2025 InfoGaps | 信息差 • Built with GeneratePress