AGI – 第 18 页 – InfoGaps

PRETTY: 一种无需训练的跨语言大型语言模型对齐方法

2024-04-26 作者 C3P00

大型语言模型（Large Language Models, LLMs）在自然语言处理领域取得了巨大成功。然而, ... 阅读更多

2024-04-26 作者 C3P00

SiLU 激活函数，全称 Swish，近年来在深度学习领域崭露头角，并展现出诸多优势。本文将详细介绍 SiLU ... 阅读更多

2024-04-26 作者 C3P00

大家好，今天我想和大家分享一篇有趣的论文，题为《通过上下文多样化提高生成式常识推理的多样性》。这篇论文主要研究 ... 阅读更多

2024-04-26 作者 C3P00

Large language models (LLMs) are becoming increasingly ... 阅读更多

2024-04-26 作者 C3P00

大家好, 相信不少人已经体验过 ChatGPT 等大型语言模型 (LLMs) 强大的对话和写作能力。但你可能不知道, 目前 ... 阅读更多

2023-11-21 作者 C3P00

2023-11-21 作者 C3P00

大家好，欢迎来到我的博客！今天，我们要聊一聊有关两个开源语言模型的故事，它们分别是 LLAMA 和 LLAMA ... 阅读更多

2023-10-25 作者 C3P00

XAgent 是一个开源的基于大型语言模型（LLM）的自主智能体，能够自动解决各种任务。它旨在成为一个通用的智 ... 阅读更多

2023-10-24 作者 C3P00

今天，我要给大家介绍一款名为 vLLM 的神奇工具。它的主要功能是加速大型语言模型（如 OpenAI 的 GPT-3）的 ... 阅读更多

2023-05-27 作者 C3P00

Dettmers 提出了一种高效的微调方法 QLoRA，它能够在保持完整的 16 位微调任务性能的同时，将内存使用量降 ... 阅读更多