跳至内容

InfoGaps | 信息差

  • Forum
  • Friends
  • Join
  • About

AI

深入解析 LoRA+:如何通过调整学习率进一步优化 LLM

2024-05-28 作者 C3P00

在当前大规模语言模型 (LLM) 的参数高效微调方法中,LoRA(Low-Rank Adaptation) 无疑是一 ... 阅读更多

分类 AI 发表评论

论文分享:Score Identity Distillation——更快更好的扩散模型蒸馏方法

2024-05-28 作者 C3P00

引言 今天我们分享的是一篇名为 《Score Identity Distillation: Exponentia ... 阅读更多

分类 AI 发表评论

Fast Transformer Decoding: One Write-Head is All You Need

2024-05-28 作者 C3P00

引言 《Fast Transformer Decoding: One Write-Head is All Yo ... 阅读更多

分类 AI 发表评论

OpenVINO-Java-API

2024-05-28 作者 C3P00

📚 简介 OpenVINO™ 是一个用于优化和部署 AI 推理的开源工具包,旨在提升深度学习在计算机视觉、自动 ... 阅读更多

分类 AI 发表评论

GQA: 从多头检查点训练广义多查询变换模型

2024-05-28 作者 C3P00

引言 在自然语言处理领域,如何在不牺牲模型质量的前提下实现更快的推理速度一直是一个重要的研究课题。本文将介绍一 ... 阅读更多

分类 AI 发表评论

缓存与效果的极限拉扯:从 MHA 、 MQA 、 GQA 到 MLA

2024-05-28 作者 C3P00

引言 最近,幻方发布的 DeepSeek-V2 引起了广泛关注。其 1 块钱 100 万 token 的价格令人惊叹,而背后的 ... 阅读更多

分类 AI 发表评论

生成扩散模型漫谈 (二十四):少走捷径,更快到达

2024-05-28 作者 C3P00

引言 在生成扩散模型的应用中,如何在保证生成质量的前提下减少采样步数一直是一个关键问题。本文将介绍一种名为 「S ... 阅读更多

分类 AI 发表评论

学习超越模式匹配?评估 LLMs 的数学理解能力

2024-05-28 作者 C3P00

作者 Siyuan Guo, Aniket Didolkar, Nan Rosemary Ke, Anirud ... 阅读更多

分类 AI 发表评论

多模态数据集提升药物不良事件检测:语料库创建与模型开发

2024-05-28 作者 C3P00

引言 药物不良事件 (Adverse Drug Events,ADEs) 的挖掘在药物警戒中至关重要,通过识别与药 ... 阅读更多

分类 AI 发表评论

探索 ReRoPE:一种崭新的位置编码方法

2024-05-28 作者 C3P00

在 Transformer 模型的演进过程中,位置编码一直是关键的一环。最近,笔者引入了一种新的位置编码方法— ... 阅读更多

分类 AI 发表评论

Luban:通过自主具身验证构建开放式创造性代理

2024-05-28 作者 C3P00

人工智能研究的终极目标之一是构建开放式代理,而创造性代理更是其中最具吸引力的一类。然而,现有的大型语言模型 (L ... 阅读更多

分类 AI 发表评论

探索超越模式匹配:解析大语言模型的数学理解

2024-05-28 作者 C3P00

随着科学发现逐渐依赖于大语言模型 (LLMs) 的辅助,我们开始看到这一领域的突破性进展。本文由 Siyuan G ... 阅读更多

分类 AI 发表评论
较早文章
较新文章
← 上一页 页面 1 页面 2 页面 3 页面 4 … 页面 8 下一页 →

Recent Posts

  • 笔墨风云:大明帝国的隐秘回响与清史笔下的双面镜像
  • 清朝修明史,为什么有很多人不认同?
  • 酸浆的迷雾守护:乾隆的豆汁、朊病毒的隐秘诅咒,与清代历史的层层真相
  • 能不能分享一些灵视提高了之后,恍然大悟的事情?
  • 何谓大一统,清:我统一了发型算么?

Recent Comments

  1. 宁波健康婴儿被医生做手术致死案 – InfoGaps | 信息差 发表在 柬埔寨婴儿活体干细胞丑闻
  2. 柬埔寨婴儿活体干细胞丑闻 – InfoGaps | 信息差 发表在 🩸 手术台上的幽灵:刘翔峰的 「替罪羊」 面纱与罗帅宇的坠楼黑洞——湘雅二院的深渊回响
  3. 小邮差 发表在 咕咚一声,华夏沉海:癸酉本 〈红楼梦〉 的千年一叹
  4. 小邮差 发表在 咕咚一声,华夏沉海:癸酉本 〈红楼梦〉 的千年一叹
  5. 小邮差 发表在 PHP 8.3 @ Ubuntu 无法开启 JIT 的问题

Archives

  • 2026 年 1 月
  • 2025 年 12 月
  • 2025 年 11 月
  • 2025 年 9 月
  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 4 月
  • 2024 年 9 月
  • 2024 年 8 月
  • 2024 年 7 月
  • 2024 年 6 月
  • 2024 年 5 月
  • 2024 年 4 月
  • 2024 年 1 月
  • 2023 年 12 月
  • 2023 年 11 月
  • 2023 年 10 月
  • 2023 年 9 月
  • 2023 年 6 月
  • 2023 年 5 月
  • 2023 年 4 月
  • 2023 年 3 月

Categories

  • AGI
  • AI
  • CPU
  • GPU
  • Uncategorized
  • 人物志
  • 信息差
  • 军事
  • 加密货币
  • 历史
  • 商业
  • 安全和内幕
  • 市场和投资
  • 心理学
  • 政治
  • 教材
  • 教育
  • 教育与考试
  • 文明和冲突
  • 架构师
  • 爱与情感
  • 男女关系
  • 硬件设备
  • 科学
  • 算法
  • 经济
  • 统治与剥削
  • 网络
  • 英语
  • 资讯
  • 软件
  • 黑幕
© 2026 InfoGaps | 信息差 • Built with GeneratePress