跳至内容

InfoGaps | 信息差

  • Forum
  • Friends
  • Join
  • About

C3P00

Caddy 2 中配置缓存

2024-05-28 作者 C3P00

在 Caddy 2 中配置缓存可以使用 cache-handler 插件。以下是配置 Caddy 2 缓存的步骤: 在这个 ... 阅读更多

分类 Web 发表评论

深入解析 LoRA+:如何通过调整学习率进一步优化 LLM

2024-05-28 作者 C3P00

在当前大规模语言模型 (LLM) 的参数高效微调方法中,LoRA(Low-Rank Adaptation) 无疑是一 ... 阅读更多

分类 AI 发表评论

论文分享:Score Identity Distillation——更快更好的扩散模型蒸馏方法

2024-05-28 作者 C3P00

引言 今天我们分享的是一篇名为 《Score Identity Distillation: Exponentia ... 阅读更多

分类 AI 发表评论

Fast Transformer Decoding: One Write-Head is All You Need

2024-05-28 作者 C3P00

引言 《Fast Transformer Decoding: One Write-Head is All Yo ... 阅读更多

分类 AI 发表评论

OpenVINO-Java-API

2024-05-28 作者 C3P00

📚 简介 OpenVINO™ 是一个用于优化和部署 AI 推理的开源工具包,旨在提升深度学习在计算机视觉、自动 ... 阅读更多

分类 AI 发表评论

GQA: 从多头检查点训练广义多查询变换模型

2024-05-28 作者 C3P00

引言 在自然语言处理领域,如何在不牺牲模型质量的前提下实现更快的推理速度一直是一个重要的研究课题。本文将介绍一 ... 阅读更多

分类 AI 发表评论

缓存与效果的极限拉扯:从 MHA 、 MQA 、 GQA 到 MLA

2024-05-28 作者 C3P00

引言 最近,幻方发布的 DeepSeek-V2 引起了广泛关注。其 1 块钱 100 万 token 的价格令人惊叹,而背后的 ... 阅读更多

分类 AI 发表评论

生成扩散模型漫谈 (二十四):少走捷径,更快到达

2024-05-28 作者 C3P00

引言 在生成扩散模型的应用中,如何在保证生成质量的前提下减少采样步数一直是一个关键问题。本文将介绍一种名为 「S ... 阅读更多

分类 AI 发表评论

学习超越模式匹配?评估 LLMs 的数学理解能力

2024-05-28 作者 C3P00

作者 Siyuan Guo, Aniket Didolkar, Nan Rosemary Ke, Anirud ... 阅读更多

分类 AI 发表评论

多模态数据集提升药物不良事件检测:语料库创建与模型开发

2024-05-28 作者 C3P00

引言 药物不良事件 (Adverse Drug Events,ADEs) 的挖掘在药物警戒中至关重要,通过识别与药 ... 阅读更多

分类 AI 发表评论
较早文章
较新文章
← 上一页 页面 1 … 页面 59 页面 60 页面 61 … 页面 116 下一页 →

Recent Posts

  • 🌌 从打工到自由:赚钱效率的系统博弈
  • 香烟的秘密契约:从一根烟到国家货币的稳定之谜
  • 🌍 从 「知识分子」 到 「公知」:词语的漂移之旅
  • 🌌 从书斋到世界:知识分子为何易被欧美 「渗透」?
  • 哟西!宗桑!请在这里坐,你滴红点点我滴已经大大滴贴好了!

Recent Comments

  1. admin 发表在 PHP 8.3 @ Ubuntu 无法开启 JIT 的问题
  2. C3P00 发表在 RWKV-5 详细解析:理解并行训练的 RNN 网络
  3. C3P00 发表在 【重磅】 从 RAG 到 Self-RAG:LLM 的知识增强
  4. C3P00 发表在 🔑 密码的终结者:WebAuthn API 深度解析
  5. C3P00 发表在 英特尔重拳出击:全新"纯大核"处理器或将改变市场格局
© 2025 InfoGaps | 信息差 • Built with GeneratePress