跳至内容

InfoGaps | 信息差

  • Forum
  • Friends
  • Join
  • About

月度归档: 2024 年 5 月

深入解析 LoRA+:如何通过调整学习率进一步优化 LLM

2024-05-28 作者 C3P00

在当前大规模语言模型 (LLM) 的参数高效微调方法中,LoRA(Low-Rank Adaptation) 无疑是一 ... 阅读更多

分类 AI 发表评论

论文分享:Score Identity Distillation——更快更好的扩散模型蒸馏方法

2024-05-28 作者 C3P00

引言 今天我们分享的是一篇名为 《Score Identity Distillation: Exponentia ... 阅读更多

分类 AI 发表评论

Fast Transformer Decoding: One Write-Head is All You Need

2024-05-28 作者 C3P00

引言 《Fast Transformer Decoding: One Write-Head is All Yo ... 阅读更多

分类 AI 发表评论

OpenVINO-Java-API

2024-05-28 作者 C3P00

📚 简介 OpenVINO™ 是一个用于优化和部署 AI 推理的开源工具包,旨在提升深度学习在计算机视觉、自动 ... 阅读更多

分类 AI 发表评论

GQA: 从多头检查点训练广义多查询变换模型

2024-05-28 作者 C3P00

引言 在自然语言处理领域,如何在不牺牲模型质量的前提下实现更快的推理速度一直是一个重要的研究课题。本文将介绍一 ... 阅读更多

分类 AI 发表评论

缓存与效果的极限拉扯:从 MHA 、 MQA 、 GQA 到 MLA

2024-05-28 作者 C3P00

引言 最近,幻方发布的 DeepSeek-V2 引起了广泛关注。其 1 块钱 100 万 token 的价格令人惊叹,而背后的 ... 阅读更多

分类 AI 发表评论

生成扩散模型漫谈 (二十四):少走捷径,更快到达

2024-05-28 作者 C3P00

引言 在生成扩散模型的应用中,如何在保证生成质量的前提下减少采样步数一直是一个关键问题。本文将介绍一种名为 「S ... 阅读更多

分类 AI 发表评论

学习超越模式匹配?评估 LLMs 的数学理解能力

2024-05-28 作者 C3P00

作者 Siyuan Guo, Aniket Didolkar, Nan Rosemary Ke, Anirud ... 阅读更多

分类 AI 发表评论

多模态数据集提升药物不良事件检测:语料库创建与模型开发

2024-05-28 作者 C3P00

引言 药物不良事件 (Adverse Drug Events,ADEs) 的挖掘在药物警戒中至关重要,通过识别与药 ... 阅读更多

分类 AI 发表评论

探索 ReRoPE:一种崭新的位置编码方法

2024-05-28 作者 C3P00

在 Transformer 模型的演进过程中,位置编码一直是关键的一环。最近,笔者引入了一种新的位置编码方法— ... 阅读更多

分类 AI 发表评论

器官移植:供体死亡前后的关键时刻

2024-05-28 作者 C3P00

器官移植是一项复杂而精细的医学技术,它在挽救生命和改善生活质量方面发挥了巨大作用。然而,关于器官移植供体的死亡 ... 阅读更多

分类 黑幕 发表评论

Luban:通过自主具身验证构建开放式创造性代理

2024-05-28 作者 C3P00

人工智能研究的终极目标之一是构建开放式代理,而创造性代理更是其中最具吸引力的一类。然而,现有的大型语言模型 (L ... 阅读更多

分类 AI 发表评论
较早文章
较新文章
← 上一页 页面 1 … 页面 4 页面 5 页面 6 … 页面 26 下一页 →

Recent Posts

  • 仁慈的价码:当一只龙虾游过资本的 「斩杀线」
  • 🌩️ 社会动力学的临界点:解构大泽乡雨夜的那场 「屠龙」 实验
  • 红色的双螺旋:在 DNA 序列中寻找汉文明的 「反脆弱」 密码
  • 文明的血脉:被抽离的金银与永恒的创造力
  • 教育的社会服从性筛选功能:信号理论、贝氏拟态与剧场效应的综合分析

Recent Comments

  1. 小邮差 发表在 世界,您好!
  2. 小邮差 发表在 咕咚一声,华夏沉海:癸酉本 〈红楼梦〉 的千年一叹
  3. 小邮差 发表在 咕咚一声,华夏沉海:癸酉本 〈红楼梦〉 的千年一叹
  4. 小邮差 发表在 PHP 8.3 @ Ubuntu 无法开启 JIT 的问题
  5. C3P00 发表在 RWKV-5 详细解析:理解并行训练的 RNN 网络

Archives

  • 2026 年 1 月
  • 2025 年 12 月
  • 2025 年 11 月
  • 2025 年 9 月
  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 4 月
  • 2024 年 9 月
  • 2024 年 8 月
  • 2024 年 7 月
  • 2024 年 6 月
  • 2024 年 5 月
  • 2024 年 4 月
  • 2024 年 1 月
  • 2023 年 12 月
  • 2023 年 11 月
  • 2023 年 10 月
  • 2023 年 9 月
  • 2023 年 6 月
  • 2023 年 5 月
  • 2023 年 4 月
  • 2023 年 3 月

Categories

  • AGI
  • AI
  • CPU
  • GPU
  • Uncategorized
  • 人物志
  • 信息差
  • 军事
  • 加密货币
  • 历史
  • 商业
  • 安全和内幕
  • 市场和投资
  • 心理学
  • 政治
  • 教材
  • 教育
  • 教育与考试
  • 文明和冲突
  • 架构师
  • 爱与情感
  • 男女关系
  • 硬件设备
  • 科学
  • 算法
  • 经济
  • 统治与剥削
  • 网络
  • 英语
  • 资讯
  • 软件
  • 黑幕
© 2025 InfoGaps | 信息差 • Built with GeneratePress