跳至内容

InfoGaps | 信息差

  • Forum
  • Friends
  • Join
  • About

AI

FILM-7B: A Large Language Model that Makes Full Use of Context

2024-04-26 作者 C3P00

Large language models (LLMs) are becoming increasingly … 阅读更多

分类 AGI 标签 AGI、 AI 发表评论

如何让大型语言模型(LLMs)充分利用长文本信息?——微软提出的FILM方法

2024-04-26 作者 C3P00

大家好,相信不少人已经体验过ChatGPT等大型语言模型(LLMs)强大的对话和写作能力。但你可能不知道,目前 … 阅读更多

分类 AGI 标签 AGI、 AI 发表评论

破解AI模型速度瓶颈:一种全新的“分组查询注意力”方法

2023-11-21 作者 C3P00
分类 AGI 标签 AGI、 AI 发表评论

从 LLAMA 到 LLAMA2:开源模型的进化之路

2023-11-21 作者 C3P00

大家好,欢迎来到我的博客!今天,我们要聊一聊有关两个开源语言模型的故事,它们分别是 LLAMA 和 LLAMA … 阅读更多

分类 AGI 标签 AGI、 AI 发表评论

XAgent:面向复杂任务解决的自主智能体

2023-10-25 作者 C3P00

XAgent 是一个开源的基于大型语言模型(LLM)的自主智能体,能够自动解决各种任务。它旨在成为一个通用的智 … 阅读更多

分类 AGI 标签 AGI、 AI 发表评论

vLLM:让大型模型推理更快的工具

2023-10-24 作者 C3P00

今天,我要给大家介绍一款名为vLLM的神奇工具。它的主要功能是加速大型语言模型(如OpenAI的GPT-3)的 … 阅读更多

分类 AGI 标签 AGI、 AI、 GPU 发表评论

QLoRA: 高效Finetuning 量化 LLMs

2023-05-27 作者 C3P00

Dettmers提出了一种高效的微调方法QLoRA,它能够在保持完整的16位微调任务性能的同时,将内存使用量降 … 阅读更多

分类 AGI 标签 AGI、 AI 10 条评论

知乎携手面壁智能推出全新开源大模型:CPM-Bee10b 登顶中文基座模型

2023-05-27 作者 C3P00

2023年5月27日,知乎在2023中国国际大数据产业博览会上发布了最新的大语言模型成果。知乎合伙人、首席技术 … 阅读更多

分类 AGI 标签 AGI、 AI、 中文 发表评论

ConvNeXt V2:使用遮罩自编码器共同设计和扩展ConvNets

2023-05-27 作者 C3P00

由于改进的架构和更好的表示学习框架的推动,视觉识别领域在 2020 年代初期迅速现代化并提高了性能。例如,现代 … 阅读更多

分类 AGI 标签 AGI、 AI 2 条评论

RMT 突破LLM百万Tokens上下文长度

2023-05-20 作者 C3P00

Scaling Transformer to 1M tokens and beyond with RMT 这份 … 阅读更多

分类 AGI 标签 AGI、 AI 7 条评论
较早文章
较新文章
← 上一页 页面1 … 页面8 页面9 页面10 下一页 →

Recent Posts

  • IPFS Image Block Widget
  • Numba:为Python数值计算插上翅膀的JIT编译器
  • AI代理上下文工程:Manus经验应用于企业级知识问答系统
  • Qualcomm Snapdragon X Elite 2:下一代SoC革命
  • 【智能记忆学习材料】Comparing Apples to Oranges: A Dataset & Analysis of LLM Humour Understanding from Traditional Puns to Topical Jokes.

Recent Comments

  1. admin 发表在 PHP 8.3 @ Ubuntu 无法开启JIT的问题
  2. C3P00 发表在 RWKV-5详细解析:理解并行训练的RNN网络
  3. C3P00 发表在 【重磅】从 RAG 到 Self-RAG:LLM 的知识增强
  4. C3P00 发表在 🔑 密码的终结者:WebAuthn API 深度解析
  5. C3P00 发表在 英特尔重拳出击:全新”纯大核”处理器或将改变市场格局
© 2025 InfoGaps | 信息差 • Built with GeneratePress