【重磅】从 RAG 到 Self-RAG:LLM 的知识增强

大家好,欢迎来到「AI与算法学习」!今天,我们将一起探索 LLM(大型语言模型)知识增强的新篇章——从 RAG 到 Self-RAG。 RAG:检索增强生成 RAG(Retrieval Augmented Generation)是一种将检索与生成相结合的技术,旨在提高 LLM 的准确性和可靠性。RAG 的工作原理是:先从大量文档中检索出与给定问题相关的片段,然后将这些片段作为输入,由 LLM 生成最终的回答。 Self-RAG:自我反思检索生成 Self-RAG 是 RAG 的一个改进版本,它通过引入「反思字符」来实现自我评估和输出控制。反思字符是一种特殊的标记,可以帮助模型判断输出是否相关、完整,以及是否需要额外的检索。 Self-RAG 的优势 与传统的 RAG 方法相比,Self-RAG 具有以下优势: Self-RAG 的应用 Self-RAG 可以应用于各种各样的任务,包括: 结语 RAG 和 Self-RAG 是 LLM 知识增强领域的重要技术。它们通过将检索与生成相结合,显著提高了 LLM 的准确性和可靠性。随着这些技术的不断发展,我们将看到 LLM 在越来越多的领域发挥作用。 扩展阅读

Elon Musk的新项目XAI “Gork”: 强大的人工智能系统

大家好!今天我们要来了解一个引人注目的话题,那就是科技创新巨头Elon Musk的全新项目——XAI “Gork”。这是一款全新的人工智能系统,其目标竟然是与OpenAI的ChatGPT一较高下。现在就和我一起,深入了解这款即将改变AI领域格局的产品。 首先,我们来看看Gork的基础。它基于神经网络和强化学习,这是Musk的另一家公司Neuralink在脑-机接口领域的重大突破。这种集成使Gork能够实时感知用户的思维和情绪,从而对用户有更为微妙的理解。 Gork的特性真是令人惊叹。首先,它具有卓越的多模态能力,可以理解并生成文本、图像,甚至音频。这一特性无疑将为内容生成、虚拟现实等领域带来深远影响。其次,Gork拥有庞大的知识库,能实时从互联网更新信息,为用户提供准确且最新的回应。此外,Gork的对话技巧可以媲美,甚至超越ChatGPT,它能进行自然且连贯的对话,成为聊天机器人、客户服务和其他交互应用的理想选择。最后,Gork允许用户对其行为和回应进行微调,使开发者能够根据特定任务或行业进行定制。 Gork的潜在影响也是不可忽视的。首先,Gork的出现可能会打破AI市场的格局,对已有模型形成挑战,推动该领域的竞争和创新。其次,Gork的多模态能力为新应用开启了大门,例如,具有人类理解上下文能力的虚拟助手,以及能同时生成文本、图像和音频的内容创作工具。然而,任何先进的AI系统都会引发伦理问题。Gork的模仿人类对话的能力和其广泛的知识库可能会被用于传播错误信息或进行有害活动。此外,依赖AI的行业,如医疗、金融和教育,可能会对Gork的定制功能感到非常满意,这可能会促使这些行业快速采用并将该模型集成到各个领域。 让我们再深入了解一下Gork的技术特点。Gork的架构融合了深度学习和神经网络的最新进展。它采用了与ChatGPT类似的基于Transformer的模型,但加入了一些独特的元素。它使用了一种专有的Transformer架构变体,即“GorkNet”,该架构旨在增强上下文理解和多模态能力。 Gork的训练方法也与ChatGPT有所不同。同时,Gork的大量数据源也引发了关于数据隐私和伦理问题的争论。然而,Musk公开表示,Gork的训练哲学是以“Neural Lace”为中心,这是一个他一直与之相关联的概念。这种哲学旨在确保Gork的学习过程紧密模拟人脑,使其比竞争对手更具适应性和对上下文的理解。 Elon Musk的XAI “Gork” 是一个雄心勃勃的项目,旨在推动人工智能领域的发展,挑战已有的AI模型,并开启新的应用可能性。无论你是AI开发者,还是对AI技术感兴趣的观察者,Gork的出现都值得我们密切关注。随着Gork的进一步开发和改进,我们有理由期待它将在未来改变我们与AI的交互方式,并推动AI技术的进一步创新。

【已翻车】零一万物领跑AI新纪元:Yi系列大模型首发,刷新中英文处理能力新高度

号称全球最强的国产 AI 模型竟然套壳LLaMA! 大家好,有一份重磅新闻要分享给大家!零一万物,这个在AI领域深耕多年的公司,刚刚发布了他们的首款开源大模型:Yi系列。这一系列的模型包括Yi-34B和Yi-6B,其中Yi-34B的表现更是令人瞩目。 首先,让我们看看这两款模型的强大之处。你有没有想过人工智能可以一次理解两本《三体》那么长的小说,或者超过1000页的PDF文档呢?Yi-34B做到了。它有200K的上下文窗口,可以处理大约40万汉字的超长文本输入。对于需要处理长篇中文文档、书籍或报告的场景,Yi-34B无疑是一个强大的工具。 而在中英文处理能力方面,Yi-34B更是达到了一个新的高度。在Hugging Face英文测试榜单中,Yi-34B位列第一。在中文方面,Yi-34B在C-Eval中文能力排行榜上超越了所有开源模型,包括GPT-4。无论是在CMMLU、E-Eval、Gaokao等中文评测指标上,还是在BooIQ、OBQA两个中文问答指标上,Yi-34B和Yi-6B的表现都无愧于它们的名字。 这样的成绩,离不开零一万物的技术创新。他们自主研发的规模化训练实验平台和智能数据处理管线,以及强大的AI基础设施,都为Yi系列的训练提供了坚实的支撑。 但零一万物并没有就此止步。他们正在积极研究专门处理数学问题的大模型MammoTH。同时,未来的Yi系列还将推出专长代码和数学的继续训练模型。 Yi系列的发布,无疑是人工智能领域的一大里程碑。它展示了零一万物的技术实力,也为我们揭示了人工智能的无限可能性。让我们期待Yi系列在未来能带来更多的惊喜和突破! 01-ai/Yi-34B-200K · Hugging Face

AgentVerse:开启多智能体交互的新篇章

欢迎来到AgentVerse!在这个充满可能性的世界中,我们致力于为大型语言模型(LLMs)提供一个自定义的多智能体环境。那么什么是AgentVerse呢?它是一个强大的框架,旨在简化为LLMs创建自定义多智能体环境的过程。这里,你可以快速、低成本地开发和定制你所需的环境,专注于你的研究,而不被实现细节所困扰。 AgentVerse的特色 AgentVerse的主要优势在于其高效的环境构建能力和可定制的组件。我们的框架提供了一系列基础构建模块,使得创建多智能体环境变得轻而易举。只需在配置文件中写入几行,你就可以轻松建立如LLMs的聊天室这样的基本环境。此外,AgentVerse还支持多智能体环境的工具,当前我们支持BMTools中提供的工具。 最新消息 我们在AgentVerse的开发过程中取得了一些重要的进展。首先,我们非常兴奋地分享我们的AI开源社区hugging face: AgentVerse。你可以在提供openai API密钥和openai组织代码后,尝试NLP Classroom和Prisoner’s Dilemma两个模拟应用程序。其次,我们还发布了一篇与本仓库相关的进行中的论文,详细介绍了AgentVerse的任务解决框架。我们还为你们提供了一个简单的H5宝可梦游戏,该游戏允许与宝可梦中的角色互动! 开始使用 要开始使用AgentVerse,首先你需要安装它。你可以通过 pip install -U agentverse 命令来安装,或者通过手动克隆最新的仓库来安装此包。然后,你需要按照我们的指示,导出你的OpenAI API密钥。如果你想使用BMTools提供的工具,你还需要安装BMTools。 安装完成后,你就可以开始创建你的多智能体环境了。我们在agentverse/tasks目录中提供了一些示例,你可以参考这些示例来创建你自己的环境。例如,你可以创建一个教室环境,其中有一个智能体扮演教授的角色,其他的智能体扮演学生的角色。或者,你也可以创建一个更复杂的环境,例如一个数据库诊断环境,其中一个智能体扮演首席数据库管理员的角色,其他的智能体扮演内存和CPU智能体的角色。 总的来说,无论你的需求是什么,AgentVerse都能提供一个灵活且可扩展的框架,让你能够轻松地构建和定制自己的多智能体环境。

零一万物(01.AI)推出全新AI大模型:Yi系列

欢迎诸位,我今天要分享的是一个振奋人心的新闻:零一万物(01.AI),一个全球领先的AI技术与应用公司,刚刚发布了它们新一代的AI大模型——Yi系列。Yi系列模型是一组全新的大型语言模型,它们的参数规模分别为60亿(Yi-6B)和340亿(Yi-34B)。而且,它们都支持在推理阶段将序列长度扩展至32K。 01-ai/Yi-34B · Hugging Face 一、Yi系列模型的诞生 Yi系列模型是零一万物研发团队自主训练的大语言模型。首次公开发布包含两个参数尺寸为6B和34B的双语(英/中)基础模型。它们都是以4K序列长度进行训练,但在推理时可以扩展到32K。 二、模型性能的优越表现 Yi-6B和Yi-34B基础模型在2023年11月2日发布。在模型性能上,Yi系列模型在多项评测中展现出了全球领跑的优秀性能。 对比同类型的开源模型,我们发现,不同模型可能采用不同的提示、后处理策略和取样技术,可能导致结果有显著的差异。我们的提示和后处理策略与原始基准测试保持一致,评估时采用贪婪解码,不对生成的内容进行任何后处理。对于原作者未报告的分数(包括以不同设定报告的分数),我们试图用我们的流程得出结果。 我们采用了Llama2的方法论来广泛评估模型的能力。具体来说,我们引入了PIQA、SIQA、HellaSwag、WinoGrande、ARC、OBQA和CSQA来评估常识推理能力。SquAD、QuAC和BoolQ被用来评估阅读理解能力。CSQA被单独用7-shot设置进行测试,而所有其他测试都采用了0-shot配置。此外,我们在”Math & Code”分类下引入了GSM8K(8-shot@1)、MATH(4-shot@1)、HumanEval(0-shot@1)和MBPP(3-shot@1)。由于技术限制,我们没有对Falcon-180进行QuAC和OBQA的测试,分数是通过平均剩余任务的分数得出的。由于这两项任务的分数通常低于平均值,我们认为Falcon-180B的性能没有被低估。 三、模型的使用 我们在Github仓库上提供了关于如何使用此模型的一般指导。 四、免责声明 尽管我们在训练过程中使用数据合规性检查算法,以尽我们最大的能力确保训练模型的合规性,但由于数据的复杂性和语言模型使用场景的多样性,我们无法保证模型在所有场景中都能生成正确和合理的输出。请注意,模型仍有可能产生问题输出的风险。我们对任何由误用、误导、非法使用和相关的错误信息,以及任何相关的数据安全问题产生的风险和问题不承担责任。 五、许可证 Yi系列模型完全开放给学术研究和经过申请许可的免费商业使用。所有使用必须遵守模型许可协议2.0。要申请正式的商业许可证,请通过yi@01.ai与我们联系。 六、结语 Yi系列模型的诞生和发展,标志着我们正在走向人工智能的新纪元——AI 2.0。我们期待与全球的研究者、开发者和企业等合作伙伴一起,共同推动AI的进步,共同创造一个更智能、更美好的未来。 让我们一起迎接这个全新的世界,一个由零一万物打造的,由Yi系列大模型技术推动的,AI 2.0的世界。

AI Comic Factory: 使用LLM + SDXL生成漫画

大家是否曾经梦想过自己是一名漫画家?现在,借助AI Comic Factory项目,你可以轻松实现这个梦想!这个项目由GitHub用户jbilcke-hf创建,旨在使用LLM(Large Language Model)和SDXL(Stable Diffusion XL)技术生成漫画面板。这个项目由Hugging Face提供技术支持,他们一直致力于开发强大的自然语言处理工具。让我们一起深入了解AI Comic Factory的魅力吧! AI Comic Factory项目的目标非常明确:使用先进的人工智能技术生成漫画面板。这里使用的技术包括LLM和SDXL。LLM是指大型语言模型,它具备强大的自然语言理解和生成能力。而SDXL则是指稳定扩散XL,它是一种用于生成图像的技术。通过将这两种技术结合起来,AI Comic Factory能够自动生成精美的漫画面板,让你的创意得以实现。 AI Comic Factory的使用非常简单。你可以通过GitHub上的链接访问项目的主页。在主页上,你可以找到详细的文档和指南,了解如何使用该项目生成漫画面板。你还可以在项目的代码库中查看源代码,了解项目的工作原理。如果你是一名开发者,你甚至可以Fork该项目并进行定制,以适应自己的需求。 AI Comic Factory不仅适用于个人创作者,也适用于漫画工作室和出版商。通过自动化的漫画生成流程,你可以节省大量的时间和精力,并且获得高质量的漫画面板。该项目还提供了灵活的配置选项,让你能够根据自己的喜好和需求进行定制。 AI Comic Factory是一个令人兴奋的项目,它为漫画创作提供了全新的可能性。无论你是一名漫画爱好者还是一名专业的漫画家,都可以从中受益。不妨点击上面的链接,了解更多关于AI Comic Factory的信息,并开始你的漫画创作之旅吧!让我们一起用技术的力量创造出精彩纷呈的漫画世界! AI Comic Factory – a Hugging Face Space by jbilcke-hf

揭秘LocalAI.io——打造智能化未来的引领者

在这个飞速发展的数字化时代,人工智能正逐渐渗透到我们生活的方方面面。今天,我将向大家介绍一个引领人工智能领域的先锋——LocalAI.io。他们凭借着一系列独特的技术和创新理念,正为我们揭示一个更加智能化的未来。接下来,就让我们一起走进LocalAI.io的世界,看看他们是如何改变我们的生活吧! LocalAI.io是一个致力于推动人工智能技术创新的公司。他们通过开发一系列易于使用的工具和平台,降低了人工智能技术的门槛,让更多人能够轻松体验到智能科技的魅力。他们的产品覆盖了图像识别、自然语言处理、机器学习等多个领域,为我们带来了更便捷、更高效的智能服务。 在图像识别方面,LocalAI.io研发出了一款名为“智图”的软件。它能够迅速识别出图片中的物体、人脸等信息,并对其进行精准分类。无论是照片管理、安防监控还是自动驾驶等领域,智图都能发挥出强大的作用。这让图像识别技术变得更加普及,为我们的生活带来了诸多便利。 除了图像识别外,LocalAI.io还在自然语言处理领域取得了卓越成就。他们推出的“智语”平台,能够实现语音识别、文本生成、情感分析等功能。无论是智能家居、智能客服还是语音助手等应用场景,“智语”都能为用户提供高效、便捷的语音交互体验。 在探寻未来科技的道路上,LocalAI.io从未止步。他们以创新的思维,不断推动着人工智能技术的进步。与此同时,他们还关注着技术的普及与应用,让更多人享受到科技带来的福祉。正是有了像LocalAI.io这样的企业,我们的世界正变得越来越智能化,越来越美好。希望在未来,他们能够继续发挥领导力,携手我们共创一个充满智慧与创造力的新时代。

使用24GB消费级GPU进行20B LLMs的RLHF微调

欢迎各位读者,今天我们要聊聊一件新鲜事。没错,就是在一台24GB的消费级GPU上,如何对20B参数的大型语言模型(LLM)进行RLHF(人工反馈强化学习)的微调。这个工作得益于我们的新工具——trl和peft的完美结合。让我们一起来探索这个新颖的微调方法,以及它如何变得更加容易实现。 一、 LLMs & RLHF:AI领域的新星 首先,让我们来了解一下大型语言模型(LLMs)和人工反馈强化学习(RLHF)。结合使用LLMs和RLHF,我们可以构建出像ChatGPT这样的强大AI系统。这个过程通常包括三个步骤:首先,我们在特定领域或语料库的指令和人类示例上微调预训练的LLM;然后,我们收集一个人工注释的数据集,训练一个奖励模型;最后,我们用奖励模型和这个数据集使用RL(比如PPO)进一步微调第一步中的LLM。 二、 什么是TRL? trl库的目标是使RL步骤更容易和更灵活,任何人都可以在自定义的数据集和训练设置上使用RL微调他们的LM。你可以使用trl来运行最流行的深度RL算法,PPO,这可以在分布式方式或单一设备上实现!为了实现这一目标,我们利用了Hugging Face生态系统中的accelerate工具,以便任何用户都可以扩大实验规模。 三、 大规模训练的挑战 大规模训练可能会遇到挑战。首要挑战是将模型及其优化器状态装入可用的GPU设备。一个参数在GPU内存中所占的空间取决于其”精度”(或者更具体地说,dtype)。最常见的dtype包括float32(32位),float16和bfloat16(16位)。简单来说,要在GPU设备上加载一个模型,每十亿个参数在float32精度下需要4GB的内存,在float16下需要2GB,而在int8下需要1GB。 四、 8位矩阵乘法 8位矩阵乘法是一种高效的方法,首次在论文LLM.int8()中提出,旨在解决量化大规模模型时性能下降的问题。简单地说,如果你使用8位矩阵乘法,你可以将全精度模型的大小减少4倍(因此,对于半精度模型,可以减少2倍)。 五、 低秩适应和PEFT 在2021年的论文LoRA: Low-Rank Adaption of Large Language Models中,研究者们证明了可以通过冻结预训练的权重并创建低秩版本的注意力矩阵的查询和值层,对大型语言模型进行微调。这种技术使LLMs的微调只需要一小部分的内存需求。 六、 什么是PEFT? 参数高效微调(PEFT)是一个由Hugging Face创建的库,用于支持在LLMs上创建和微调适配器层。peft已经无缝地集成了Accelerate,可以利用DeepSpeed和Big Model Inference对大规模模型进行扩展。 七、 20B参数模型的低秩适配器微调 那么,现在让我们来具体谈谈如何在24GB的消费级GPU上对20B参数的LLM进行微调。我们通过使用TRL库,可以在个人的数据集和训练设置中用RL微调LM。TRL库使用Hugging Face生态系统的accelerate工具,使得任何用户都可以将实验规模扩大到有趣的范围。 而在大规模训练中,首要的挑战是如何将模型及其优化器状态装入可用的GPU设备。一种有效的解决方案是使用8位矩阵乘法,这种方法能够减少全精度模型的大小,从而使其适应硬件资源。 同时,我们引入了低秩适应和PEFT技术。低秩适应是一种可以通过冻结预训练的权重并创建低秩版本的注意力矩阵的查询和值层,对大型语言模型进行微调的技术。这种技术使LLMs的微调只需要一小部分的内存需求。而PEFT(参数高效微调)则是一个由Hugging Face创建的库,用于支持在LLMs上创建和微调适配器层。 这样,我们就可以在24GB的消费级GPU上进行20B参数模型的低秩适配器微调了。这个过程中,我们使用了trl和peft的集成,使得大型语言模型的微调变得更加容易实现,也更适应于硬件资源。 总的来说,我们现在有了更多的工具和方法来更有效地微调大型语言模型,这将使得AI系统,如ChatGPT,变得更加强大和实用。这是一次令人兴奋的进步,也预示着AI技术将带来更多的可能性。

将艺术赋予控制力:探索ControlNet在Diffusers中的应用

大家好,我来给大家介绍一项令人兴奋的技术——ControlNet。这项技术为我们提供了一种全新的方法,让我们能够在图像生成过程中拥有更大的控制权。那么,ControlNet究竟是什么呢?又能带给我们怎样的可能性呢?接下来,让我们一起揭开ControlNet的神秘面纱。 ControlNet简介 ControlNet是由张璐民和Maneesh Agrawala在其研究成果“Adding Conditional Control to Text-to-Image Diffusion Models”中提出的一种框架。它提供了一种支持各种空间上下文的方法,这些上下文可以作为Diffusion模型(如Stable Diffusion)的额外条件。让我们通过一些例子来看看ControlNet的强大之处。 想象一下,你有一个卡通图案,你想将它转化成一张逼真的照片,或者你有一个室内设计的草图,你希望看看它在现实中的效果。这些都可以通过ControlNet来实现。你甚至可以让一些著名的标志图案栩栩如生。ControlNet的应用极限只在于你的想象力。 ControlNet的工作原理 那么,ControlNet是如何工作的呢?首先,我们复制一个Diffusion模型(例如Stable Diffusion)的预训练参数,并将其称为“可训练副本”,同时也保留预训练参数的另一份副本,称为“锁定副本”。”可训练副本”用于学习任务特定的内容,而”锁定副本”则用于保留大数据集中学习到的丰富知识。然后,通过优化为ControlNet框架设计的“零卷积”层,将两份参数连接起来。这是一种训练技巧,可以在训练新条件时保留模型已经学到的语义。 体验ControlNet 接下来,让我们亲自体验一下ControlNet。首先,我们需要确保已经安装了所有必要的库。我们还需要安装一些额外的依赖项,以便处理不同的ControlNet条件。 准备好之后,我们就可以开始了。我们选择了一幅著名的画作——《戴珍珠耳环的少女》作为例子。首先,我们将图像进行Canny预处理,这实际上是一个边缘检测的过程。 之后,我们加载预训练的模型,并将模型设置为半精度(torch.dtype),以便进行快速且内存高效的推理。在加载模型时,我们还使用了一个叫做UniPCMultistepScheduler的调度器,它能大幅减少推理时间。 接下来,我们将管道设置为开启智能CPU卸载,并启用FlashAttention/xformers注意力层加速,以节省内存消耗并提高推理速度。 准备工作完成后,我们就可以开始运行ControlNet管道了!我们以“Sandra Oh,最高质量,极其详细”为提示,生成了一系列惊人的图像。其中,我们还可以看到一些现代名人仿照17世纪的这幅画作进行摆拍的图像。 结语 ControlNet技术为我们提供了一个全新的创作方式,让我们能够在生成过程中拥有更多的控制权。我们期待着看到更多的创新应用和独特创作。感谢你的阅读,我们下次再见!

Würstchen:引领图像生成的速度革新

大家好,今天我要给大家介绍一款名为 Würstchen 的新型图像生成模型。这款模型由 Hugging Face 公司开发,它是一种扩散模型,能够在高度压缩的图像潜在空间中进行文本条件操作。这项技术的优势在于能大大降低训练和推理的计算成本。以前我们在处理 1024×1024 的图像时,需要花费大量的计算资源,而现在,通过 Würstchen,我们可以用相当于 32×32 图像的资源来完成这项工作,这无疑是一个巨大的突破。 Würstchen 的设计新颖,实现了 42 倍的空间压缩,这在之前是无法想象的。它采用了两阶段压缩,我们称之为A阶段和B阶段。A阶段是一个 VQGAN,B阶段是一个扩散自编码器。A阶段和B阶段共同被称为解码器,因为它们将压缩后的图像解码回像素空间。还有一个第三阶段模型,称为 Prior,它在高度压缩的潜在空间中进行学习,这种训练需要的计算资源只是当前顶级模型的一小部分,同时也让推理变得更便宜、更快。 那么,为什么我们需要另一个文本到图像的模型呢?原因很简单,因为 Würstchen 非常快且高效。比起像 Stable Diffusion XL 这样的模型,Würstchen 可以更快地生成图像,同时使用的内存也更少。此外,Würstchen 的训练成本也大大降低,Würstchen v1 只需要 9,000 GPU 训练小时,而 Stable Diffusion 1.4 需要 150,000 GPU 训练小时。这意味着更多的组织可以训练这样的模型。 使用 Würstchen 也非常简单。您可以通过 Diffusers 库来使用它,下面是一个使用 AutoPipeline 进行推理的例子: Würstchen 在 1024×1024 到 1536×1536 之间的图像分辨率上进行训练,同时我们也注意到,在 1024×2048 这样的分辨率上,Würstchen 也能产生很好的结果。我们还发现,Prior(第三阶段模型)能够非常快速地适应新的分辨率,因此在 2048×2048 … Read more