跳至内容

InfoGaps | 信息差

  • Forum
  • Friends
  • Join
  • About

AGI

PRETTY: 一种无需训练的跨语言大型语言模型对齐方法

2024-04-26 作者 C3P00

大型语言模型 (Large Language Models, LLMs) 在自然语言处理领域取得了巨大成功。然而, ... 阅读更多

分类 AGI 标签 AGI 、 AI 发表评论

SiLU 激活函数:深度学习中的新星

2024-04-26 作者 C3P00

SiLU 激活函数,全称 Swish,近年来在深度学习领域崭露头角,并展现出诸多优势。本文将详细介绍 SiLU ... 阅读更多

分类 AGI 标签 AGI 、 AI 发表评论

通过上下文多样化提高生成式常识推理的多样性

2024-04-26 作者 C3P00

大家好,今天我想和大家分享一篇有趣的论文,题为 《通过上下文多样化提高生成式常识推理的多样性》 。这篇论文主要研究 ... 阅读更多

分类 AGI 标签 AGI 、 AI 发表评论

FILM-7B: A Large Language Model that Makes Full Use of Context

2024-04-26 作者 C3P00

Large language models (LLMs) are becoming increasingly ... 阅读更多

分类 AGI 标签 AGI 、 AI 发表评论

如何让大型语言模型 (LLMs) 充分利用长文本信息?——微软提出的 FILM 方法

2024-04-26 作者 C3P00

大家好, 相信不少人已经体验过 ChatGPT 等大型语言模型 (LLMs) 强大的对话和写作能力。但你可能不知道, 目前 ... 阅读更多

分类 AGI 标签 AGI 、 AI 发表评论

破解 AI 模型速度瓶颈:一种全新的 「分组查询注意力」 方法

2023-11-21 作者 C3P00
分类 AGI 标签 AGI 、 AI 发表评论

从 LLAMA 到 LLAMA2:开源模型的进化之路

2023-11-21 作者 C3P00

大家好,欢迎来到我的博客!今天,我们要聊一聊有关两个开源语言模型的故事,它们分别是 LLAMA 和 LLAMA ... 阅读更多

分类 AGI 标签 AGI 、 AI 发表评论

XAgent:面向复杂任务解决的自主智能体

2023-10-25 作者 C3P00

XAgent 是一个开源的基于大型语言模型 (LLM) 的自主智能体,能够自动解决各种任务。它旨在成为一个通用的智 ... 阅读更多

分类 AGI 标签 AGI 、 AI 发表评论

vLLM:让大型模型推理更快的工具

2023-10-24 作者 C3P00

今天,我要给大家介绍一款名为 vLLM 的神奇工具。它的主要功能是加速大型语言模型 (如 OpenAI 的 GPT-3) 的 ... 阅读更多

分类 AGI 标签 AGI 、 AI 、 GPU 发表评论

QLoRA: 高效 Finetuning 量化 LLMs

2023-05-27 作者 C3P00

Dettmers 提出了一种高效的微调方法 QLoRA,它能够在保持完整的 16 位微调任务性能的同时,将内存使用量降 ... 阅读更多

分类 AGI 标签 AGI 、 AI 10 条评论
较早文章
较新文章
← 上一页 页面 1 … 页面 17 页面 18 页面 19 页面 20 下一页 →

Recent Posts

  • 🌌 从打工到自由:赚钱效率的系统博弈
  • 香烟的秘密契约:从一根烟到国家货币的稳定之谜
  • 🌍 从 「知识分子」 到 「公知」:词语的漂移之旅
  • 🌌 从书斋到世界:知识分子为何易被欧美 「渗透」?
  • 哟西!宗桑!请在这里坐,你滴红点点我滴已经大大滴贴好了!

Recent Comments

  1. admin 发表在 PHP 8.3 @ Ubuntu 无法开启 JIT 的问题
  2. C3P00 发表在 RWKV-5 详细解析:理解并行训练的 RNN 网络
  3. C3P00 发表在 【重磅】 从 RAG 到 Self-RAG:LLM 的知识增强
  4. C3P00 发表在 🔑 密码的终结者:WebAuthn API 深度解析
  5. C3P00 发表在 英特尔重拳出击:全新"纯大核"处理器或将改变市场格局
© 2025 InfoGaps | 信息差 • Built with GeneratePress