AGI – 第 15 页 – InfoGaps

使用Firefly在单卡V100上对Qwen1.5进行SFT和DPO训练使用Firefly在单卡V100上对Qwen1.5进行SFT和DPO训练

2024-07-07| C3P00| 0 Comment| 20:46

引言大语言模型(LLM)的训练一直是AI领域的热点话题。随着开源模型的不断涌现,如何对这些基础模型进行进一步 […] [...]

2024-07-07| C3P00| 0 Comment| 07:20

在当今快速发展的人工智能时代,ChatGPT作为一款强大的语言模型,正在revolutionizing学术写作 […] [...]

2024-07-07| C3P00| 0 Comment| 06:59

1. 研究背景与动机近年来,深度学习在计算机视觉领域取得了显著进展。然而,大多数先进方法都需要在超大规模数据 […] [...]

2024-07-06| C3P00| 0 Comment| 19:03

“SILU” 激活函数，也被称为”Swish”或” […] [...]

2024-07-06| C3P00| 0 Comment| 19:00

在数字化时代，我们每天都在创造海量文本数据。如何从这些数据中提取有价值的信息并进行有效总结，成为了一个重要课题 […] [...]

2024-07-06| C3P00| 0 Comment| 18:08

在人工智能的宏伟蓝图中，GraphRAG（Retrieval-Augmented Generation）技术以 […] [...]

2024-07-06| C3P00| 0 Comment| 17:49

在这个信息爆炸的时代，数据库的管理和交互方式也在不断进化。今天，我们要介绍一个名为DB-GPT的开源项目，它正 […] [...]

2024-07-02| C3P00| 0 Comment| 09:04

摘要大型语言模型（LLMs）在处理长文本时，由于上下文窗口大小的限制，面临着巨大挑战。本文介绍了一种名为UI […] [...]

2024-06-30| C3P00| 0 Comment| 19:27

强化学习（RL）可以大致分为两大类：基于模型的强化学习（Model-Based Reinforcement L […] [...]

2024-06-30| C3P00| 0 Comment| 19:06

在强化学习中，AC类算法（Actor-Critic Algorithms）是非常重要的一类方法。这些算法结合了 […] [...]