跳至内容

InfoGaps | 信息差

  • Forum
  • Friends
  • Join
  • About

AI

FILM-7B: A Large Language Model that Makes Full Use of Context

2024-04-26 作者 C3P00

Large language models (LLMs) are becoming increasingly ... 阅读更多

分类 AGI 标签 AGI 、 AI 发表评论

如何让大型语言模型 (LLMs) 充分利用长文本信息?——微软提出的 FILM 方法

2024-04-26 作者 C3P00

大家好, 相信不少人已经体验过 ChatGPT 等大型语言模型 (LLMs) 强大的对话和写作能力。但你可能不知道, 目前 ... 阅读更多

分类 AGI 标签 AGI 、 AI 发表评论

破解 AI 模型速度瓶颈:一种全新的 「分组查询注意力」 方法

2023-11-21 作者 C3P00
分类 AGI 标签 AGI 、 AI 发表评论

从 LLAMA 到 LLAMA2:开源模型的进化之路

2023-11-21 作者 C3P00

大家好,欢迎来到我的博客!今天,我们要聊一聊有关两个开源语言模型的故事,它们分别是 LLAMA 和 LLAMA ... 阅读更多

分类 AGI 标签 AGI 、 AI 发表评论

XAgent:面向复杂任务解决的自主智能体

2023-10-25 作者 C3P00

XAgent 是一个开源的基于大型语言模型 (LLM) 的自主智能体,能够自动解决各种任务。它旨在成为一个通用的智 ... 阅读更多

分类 AGI 标签 AGI 、 AI 发表评论

vLLM:让大型模型推理更快的工具

2023-10-24 作者 C3P00

今天,我要给大家介绍一款名为 vLLM 的神奇工具。它的主要功能是加速大型语言模型 (如 OpenAI 的 GPT-3) 的 ... 阅读更多

分类 AGI 标签 AGI 、 AI 、 GPU 发表评论

QLoRA: 高效 Finetuning 量化 LLMs

2023-05-27 作者 C3P00

Dettmers 提出了一种高效的微调方法 QLoRA,它能够在保持完整的 16 位微调任务性能的同时,将内存使用量降 ... 阅读更多

分类 AGI 标签 AGI 、 AI 10 条评论

知乎携手面壁智能推出全新开源大模型:CPM-Bee10b 登顶中文基座模型

2023-05-27 作者 C3P00

2023 年 5 月 27 日,知乎在 2023 中国国际大数据产业博览会上发布了最新的大语言模型成果。知乎合伙人、首席技术 ... 阅读更多

分类 AGI 标签 AGI 、 AI 、 中文 发表评论

ConvNeXt V2:使用遮罩自编码器共同设计和扩展 ConvNets

2023-05-27 作者 C3P00

由于改进的架构和更好的表示学习框架的推动,视觉识别领域在 2020 年代初期迅速现代化并提高了性能。例如,现代 ... 阅读更多

分类 AGI 标签 AGI 、 AI 2 条评论

RMT 突破 LLM 百万 Tokens 上下文长度

2023-05-20 作者 C3P00

Scaling Transformer to 1M tokens and beyond with RMT 这份 ... 阅读更多

分类 AGI 标签 AGI 、 AI 7 条评论
较早文章
较新文章
← 上一页 页面 1 … 页面 8 页面 9 页面 10 下一页 →

Recent Posts

  • 🌌 从打工到自由:赚钱效率的系统博弈
  • 香烟的秘密契约:从一根烟到国家货币的稳定之谜
  • 🌍 从 「知识分子」 到 「公知」:词语的漂移之旅
  • 🌌 从书斋到世界:知识分子为何易被欧美 「渗透」?
  • 哟西!宗桑!请在这里坐,你滴红点点我滴已经大大滴贴好了!

Recent Comments

  1. admin 发表在 PHP 8.3 @ Ubuntu 无法开启 JIT 的问题
  2. C3P00 发表在 RWKV-5 详细解析:理解并行训练的 RNN 网络
  3. C3P00 发表在 【重磅】 从 RAG 到 Self-RAG:LLM 的知识增强
  4. C3P00 发表在 🔑 密码的终结者:WebAuthn API 深度解析
  5. C3P00 发表在 英特尔重拳出击:全新"纯大核"处理器或将改变市场格局
© 2025 InfoGaps | 信息差 • Built with GeneratePress