跳至内容

InfoGaps | 信息差

  • Forum
  • Friends
  • Join
  • About

Avatar photoC3P00

Transformer 升级之路:逆用 Leaky ReRoPE 解决推理成本问题

2024-05-29 作者 C3P00

在上周的文章 《Transformer 升级之路:12 、无限外推的 ReRoPE?》 中,我们介绍了 ReRoPE 和 Le ... 阅读更多

分类 AI 发表评论

增大 Tokenizer 词表:LLM 续写任务的新挑战与解决方案

2024-05-29 作者 C3P00

语言模型 (LLM) 在自然语言处理中的应用越来越广泛,而通过增大 Tokenizer 的词表来提高压缩率,从而缩短串 ... 阅读更多

分类 AI 发表评论

Viterbi Sampling 算法的改进与完善

2024-05-29 作者 C3P00
分类 AI 发表评论

探索线性 Attention 的局限性:从 「集中注意力」 角度出发

2024-05-29 作者 C3P00

近年来,Transformer 架构在自然语言处理领域取得了显著的成果,而 Attention 机制则是其核心所在。 ... 阅读更多

分类 AI 发表评论

深度学习中的状态空间模型 (SSM) 初探

2024-05-28 作者 C3P00

引言 前几天,笔者看了几篇介绍 SSM(State Space Model) 的文章,才发现原来自己从未认真了解过 ... 阅读更多

分类 AI 发表评论

何加盐深度揭秘:我是怎么找资料的?

2024-05-28 作者 C3P00

在信息爆炸的时代,获取和整理信息的能力变得尤为重要。何加盐在其博客文章 《何加盐深度揭秘:我是怎么找资料的?》 中 ... 阅读更多

分类 信息差 发表评论

DeepSeek-V2 大模型

2024-05-28 作者 C3P00
分类 AI 发表评论

Caddy 2 中配置缓存

2024-05-28 作者 C3P00

在 Caddy 2 中配置缓存可以使用 cache-handler 插件。以下是配置 Caddy 2 缓存的步骤: 在这个 ... 阅读更多

分类 Web 发表评论

深入解析 LoRA+:如何通过调整学习率进一步优化 LLM

2024-05-28 作者 C3P00

在当前大规模语言模型 (LLM) 的参数高效微调方法中,LoRA(Low-Rank Adaptation) 无疑是一 ... 阅读更多

分类 AI 发表评论

论文分享:Score Identity Distillation——更快更好的扩散模型蒸馏方法

2024-05-28 作者 C3P00

引言 今天我们分享的是一篇名为 《Score Identity Distillation: Exponentia ... 阅读更多

分类 AI 发表评论

Fast Transformer Decoding: One Write-Head is All You Need

2024-05-28 作者 C3P00

引言 《Fast Transformer Decoding: One Write-Head is All Yo ... 阅读更多

分类 AI 发表评论

OpenVINO-Java-API

2024-05-28 作者 C3P00

📚 简介 OpenVINO™ 是一个用于优化和部署 AI 推理的开源工具包,旨在提升深度学习在计算机视觉、自动 ... 阅读更多

分类 AI 发表评论
较早文章
较新文章
← 上一页 页面 1 … 页面 48 页面 49 页面 50 … 页面 96 下一页 →

Recent Posts

  • 如何看待上海市政协委员曾宪一提出的 「取消中高考是早晚的事」​?
  • 揉成一团的 A4 纸:我眼中的国际教育奇幻漂流记
  • 拳焰焚洋:一段被误解的反帝烈火传奇
  • 虚假王冠的碎裂:小仙女神话在物理现实前的谢幕
  • 何谓肉食者鄙,该主持公道的人说你浪费粮食

Recent Comments

  1. 义和团到底吓坏了谁? – InfoGaps | 信息差 发表在 上海徐汇育婴堂的万婴坑
  2. 宁波健康婴儿被医生做手术致死案 – InfoGaps | 信息差 发表在 柬埔寨婴儿活体干细胞丑闻
  3. 柬埔寨婴儿活体干细胞丑闻 – InfoGaps | 信息差 发表在 🩸 手术台上的幽灵:刘翔峰的 「替罪羊」 面纱与罗帅宇的坠楼黑洞——湘雅二院的深渊回响
  4. 小邮差 发表在 咕咚一声,华夏沉海:癸酉本 〈红楼梦〉 的千年一叹
  5. 小邮差 发表在 咕咚一声,华夏沉海:癸酉本 〈红楼梦〉 的千年一叹

Archives

  • 2026 年 2 月
  • 2026 年 1 月
  • 2025 年 12 月
  • 2025 年 11 月
  • 2025 年 9 月
  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 4 月
  • 2024 年 9 月
  • 2024 年 8 月
  • 2024 年 7 月
  • 2024 年 6 月
  • 2024 年 5 月
  • 2024 年 4 月
  • 2024 年 1 月
  • 2023 年 12 月
  • 2023 年 11 月
  • 2023 年 10 月
  • 2023 年 9 月
  • 2023 年 6 月
  • 2023 年 5 月
  • 2023 年 4 月
  • 2023 年 3 月

Categories

  • AGI
  • AI
  • CPU
  • GPU
  • Uncategorized
  • 两性和情感
  • 人物志
  • 信息差
  • 军事
  • 加密货币
  • 历史
  • 商业
  • 安全和内幕
  • 市场和投资
  • 心理学
  • 政治
  • 教材
  • 教育
  • 教育与考试
  • 文明和冲突
  • 架构师
  • 爱与情感
  • 男女关系
  • 硬件设备
  • 科学
  • 算法
  • 经济
  • 统治与剥削
  • 网络
  • 英语
  • 资讯
  • 软件
  • 黑幕
© 2026 InfoGaps | 信息差 • Built with GeneratePress