📦 迎接 Boxo:构建 IPFS 应用的新工具箱

在当今数字化的世界中,去中心化网络的重要性愈加凸显,特别是对于数据存储和共享的需求。IPFS(星际文件系统)作为一个去中心化的文件存储协议,正逐渐成为开发者们的宠儿。然而,创建与 IPFS 互动的应用并非易事。为此,Boxo 应运而生,它是一个专为 Go 语言开发的 IPFS SDK,旨在为开发者提供构建 IPFS 应用所需的工具和组件。 🚀 Boxo 的动机与愿景 Boxo 的核心目标是简化 IPFS 应用的构建过程。开发者们过去常常面临寻找可重用代码的困境,或者在使用现有的代码时感到无从下手。Boxo 的诞生正是为了应对这一挑战。它不仅提供了一系列高质量的组件,还使这些组件更容易被发现和使用。 考虑到 IPFS 的复杂性,Boxo 的维护者们希望通过提供易用的库,降低开发者的学习曲线。这不仅能帮助那些希望用 Go 语言开发 IPFS 应用的开发者,也能减轻维护者的负担,让他们有更多时间投入到社区贡献中。 🔍 Boxo 的范围与功能 Boxo 包含了一系列与 IPFS 相关的高质量组件,适用于公共和私有 IPFS 网络的交互。这些组件涵盖了内容路由、数据传输、命名和可变性等多个方面。具体来说,Boxo 提供了以下几类功能: 值得注意的是,Boxo 并不是一个全面的 IPFS 解决方案,而是一个高质量的组件库,旨在为开发者提供一个良好的起点。 🛠️ 如何开始使用 Boxo 对于新手来说,Boxo 的使用非常简单。开发者可以通过阅读示例代码快速上手。如果你是在迁移到 Boxo,Boxo 还提供了迁移工具,能够自动化处理大部分工作,只需几个简单的命令即可完成: 这些命令将帮助你将模块升级至 Boxo 的最新版本,并检查未维护的依赖项,以便于后续的维护和更新。 🏗️ 开发与贡献 Boxo 鼓励开发者为其贡献代码,但必须满足一定的质量标准。所有被接受的代码必须经过充分测试,且具备良好的文档支持。这意味着,开发者需要提供至少单元测试,并为复杂的组件编写详细的说明文档。 对于那些希望将自己的 … Read more

🚀 Chat2DB:AI驱动的数据开发与分析平台

在当今数据驱动的时代,数据不仅是企业决策的重要依据,更是推动创新的核心动力。然而,数据的复杂性往往让许多人却步,尤其是那些没有技术背景的用户。Chat2DB的出现,正是为了打破这一壁垒,让每个人都能轻松利用数据,发掘其真正的价值。 💡 AI的智能助力 Chat2DB 是一个全链路数据管理平台,集数据管理、研发、分析与应用于一体。无论您的数据存储在哪里,Chat2DB都能无缝对接。例如,用户可以通过自然语言进行SQL查询,甚至无需深入学习SQL语法。这项技术的背后,是先进的AI驱动的智能SQL研发功能,使得每位用户都能轻松驾驭复杂的数据操作。 通过使用自然语言转SQL的功能,用户只需输入简单的问句,系统便能将其转换为相应的SQL查询,极大地降低了数据处理的门槛。想象一下,你只需问“过去一年内,销售额最高的产品是什么?”而不是编写复杂的SQL代码,这让数据的探索变得简单而直观。 📊 数据可视化与智能报表 数据的力量不仅在于其存储,更在于其呈现。Chat2DB通过AI分析与洞察功能,能够将复杂的数据集自动渲染为易于理解的报表。用户无需掌握复杂的查询语言或专业的数据分析知识,只需以自然语言表达需求,便能获取专家级的洞察。 下图展示了Chat2DB智能报表的生成过程,用户只需输入需求,系统便能提供相应的可视化图表: 这种直观的方式,不仅提升了决策的快速性,也提升了决策的精准性。数据从繁琐的表格中解放出来,以图表的形式展现在用户面前,仿佛为他们打开了一扇全新的视窗。 🔍 深度的数据探索 Chat2DB的AI数据对话页面使得不同角色的用户可以轻松与数据进行互动。对于业务人员而言,他们无需深入了解数据源的复杂性,只需专注于提出问题和解读答案。而数据分析人员则可以直接使用自然语言提出分析需求,轻松实现复杂的数据分析。 例如,业务人员可以询问“我们上个月的总销售额是多少?”而分析人员则可以深入挖掘,询问“客户购买行为的变化趋势如何?”这种灵活性让数据分析不再是技术人员的专利,而是每个部门都能参与的活动。 🌐 多种数据库无缝集成 在数据管理的过程中,Chat2DB支持多达17种不同的数据库类型,包括关系型和非关系型数据库。这意味着,无论您使用的是MySQL、PostgreSQL还是MongoDB,Chat2DB都能提供集中化管理的解决方案。用户不再需要在不同的平台之间反复切换,数据管理变得更加便捷高效。 这种集中式的管理方式,类似于将不同类型的乐器整合成一支交响乐队,各种数据源在Chat2DB的指挥下,和谐地演奏出美妙的乐章。 📈 数据驱动的决策支持 在AI时代,数据不仅是历史记录,更是未来决策的重要依据。Chat2DB通过自动化的报表和智能分析,帮助企业及时获得市场反馈,迅速做出反应。例如,系统能够自动识别销售数据中的异常波动,并向管理层发出警报,使得决策者可以迅速采取措施。 这一切都得益于Chat2DB背后强大的AI算法,这些算法能够从庞大的数据集中提取出真正有价值的信息,支持快速决策,帮助企业在竞争中立于不败之地。 🎉 结语 无论是企业的决策者,还是普通的数据使用者,Chat2DB都致力于让数据变得更加简单易用。通过AI技术的赋能,数据不再是障碍,而是推动每个人创新和解决问题的工具。让我们一起期待一个数据驱动的新纪元,在这个时代,数据的力量将被每一个人所掌握。 📚 参考文献 希望这篇文章能够帮助您更好地理解Chat2DB的价值与潜力!

Mem0:AI应用的记忆层🧠

在当今的人工智能(AI)领域,如何提升用户体验和降低运营成本成为了开发者们亟需解决的难题。Mem0应运而生,作为一款自我改进的记忆层,它为大型语言模型(LLM)应用提供了个性化的AI体验,不仅能够让用户感到愉悦,还能显著节省开支。 💡 记忆的力量 Mem0能有效地记住用户的偏好与历史对话,让未来的交流更加顺畅。想象一下,如果你的AI助手能记住你喜欢的食物、兴趣爱好,甚至是你曾经提到的旅行计划,那么每次交互都将变得更具个性化。例如,当用户提到“我喜欢辛辣食物”时,Mem0会将这一信息存储在其记忆中,并在后续的对话中加以利用。 上面的代码展示了如何通过Mem0存储和检索用户偏好。通过这种方式,AI助手可以在后续对话中提供更相关的建议和服务。 💰 节省开支 Mem0还通过只向AI模型发送相关数据,帮助用户将LLM的成本降低多达80%。对于企业而言,这意味着可以在保持高效服务的同时,显著压缩预算。想象一下,企业不仅能提高客户满意度,还能优化资源配置,提升整体运营效率。 🤖 提升AI响应质量 有了Mem0,AI的响应不仅更加准确,更能在上下文中展现更强的相关性。通过记住用户的历史对话,AI能够更好地理解用户的需求,从而提供更加符合期待的答案。例如,在客户支持场景中,AI能够快速访问用户的历史记录,针对性地解决问题,提升服务质量。 🛠️ 轻松集成 Mem0的集成过程简单明了。它可以无缝地与现有的AI模型(如OpenAI和Claude)结合,开发者只需进行最小的设置,就能快速实现记忆功能。这种易用性使得Mem0在各类应用场景中都能发挥重要作用。 📚 多样化的应用场景 Mem0的应用场景广泛,包括但不限于: 🚀 轻松上手 想为你的AI应用添加记忆功能?只需短短一个周末,你就能实现这一目标。Mem0提供了简洁的文档和社区支持,帮助开发者快速入手。无论你是初学者还是经验丰富的开发者,Mem0都能让你的AI应用焕发新生。 结论 Mem0不仅是一个记忆层,更是推动AI个性化进程的重要工具。通过其强大的记忆能力,开发者能够创造出更加智能、高效的AI应用,真正实现以用户为中心的服务理念。未来,随着Mem0的广泛应用,我们将看到越来越多的AI应用能够提供更贴心、更个性化的体验。 参考文献

利用大型语言模型(LLMs)将领域知识整合到进程发现中

知识点1: 进程挖掘的基本概念 解释: 进程挖掘是利用信息系统中记录的事件数据来获取洞察并改进运营流程的一种技术。自动化的进程发现技术被用来发现描述进程执行的模型,但这项任务本质上是复杂和具有挑战性的。 题目1: 进程挖掘的主要目的是什么? A) 提高信息系统的运行速度B) 发现描述进程执行的模型并获取洞察C) 增加系统存储容量D) 减少员工工作量 答案: B 解析: 根据参考资料,”进程挖掘是利用信息系统中记录的事件数据来获取洞察并改进运营流程的一种技术。”因此,进程挖掘的主要目的是发现描述进程执行的模型并获取洞察,以便改进运营流程。 速记句: 进程挖掘:挖数据,觅模型,得洞察。 知识点2: 领域知识在进程发现中的重要性 解释: 除了从信息系统提取的事件数据外,领域专家、流程文档等领域知识资源通常在进程发现中未被充分利用。将这些知识整合到进程发现中具有挑战性,但对于发现符合实际的流程模型至关重要。 题目2: 在传统的进程发现中,哪种资源通常未被充分利用? A) 事件日志数据B) 系统性能指标C) 领域专家和流程文档等领域知识D) 软件代码 答案: C 解析: 参考资料指出,”除了从信息系统提取的事件数据外,我们通常还可以获取领域专家、流程文档和其他资源的集合,统称为领域知识,但这些在进程发现中往往无法直接使用。”这表明领域知识资源在传统进程发现中未被充分利用。 速记句: 进程发现常忽视专家文档,遗珠待拾。 知识点3: 大型语言模型(LLMs)在进程发现中的应用 解释: 本研究提出利用大型语言模型(LLMs)来整合领域知识到进程发现中。LLMs能够处理用户对话并有效理解人类推理,可以将文本输入转换为声明性规则,用于指导进程模型的构建。 题目3: 研究中提出使用大型语言模型(LLMs)的主要目的是什么? A) 替代传统的进程挖掘算法B) 提高事件日志的数据质量C) 整合领域知识到进程发现中D) 自动生成进程文档 答案: C 解析: 文章明确指出,”我们的论文通过使用大型语言模型(LLMs)来解决这些挑战,使得此类信息可以直接参与进程发现。”因此,使用LLMs的主要目的是整合领域知识到进程发现中。 速记句: LLMs桥梁作用,知识融入挖掘。 知识点4: IMr框架的基本原理 解释: IMr是一个基于归纳挖掘的框架,通过递归选择最能解释实际进程的流程结构。在每次递归中,算法从多种可能的流程结构中进行选择,使用规则来指导这一选择过程,剪枝搜索空间并消除潜在的次优流程结构。 … Read more

英国国家医疗服务体系故意害死3000多患者

英国血液污染丑闻,也被称为英国血液感染丑闻,是英国国家医疗服务体系(NHS)历史上最致命的灾难之一。根据2024年5月20日的调查报告,英国当局和公共卫生服务在20世纪70年代至90年代初,故意将成千上万的患者暴露于受污染的血液和血液产品中,导致这些患者感染了HIV或肝炎,并且这一真相被隐瞒了几十年。 据估计,约有3000人因接受受污染的血液或血液制品而死亡,许多人留下了终身疾病。这一丑闻被广泛认为是自1948年NHS成立以来最致命的灾难。调查主席、前法官Brian Langstaff批评了连续几届政府和医疗专业人员的“一连串失败”,并拒绝承担责任以保全面子和节省开支。他发现有故意掩盖丑闻的行为,还有证据表明政府官员销毁了文件。 英国首相Rishi Sunak向受害者道歉,并表示报告的发布是“英国国家的耻辱日”。调查最终批准于2017年,在过去四年中,它审查了来自5000多名证人的证据和超过100,000份文。 许多受影响的人是血友病患者,他们在70年代接受了一种新的治疗方法,这种治疗方法是从美国进口的。用于制造血液制品的血浆追溯到高风险的捐献者,包括被付费的监狱囚犯。 报告指出,大约1250名出血性疾病患者,包括380名儿童,感染了受HIV污染的血液制品,其中四分之三已经死亡。另外,还有多达5000人在接受血液制品后发展成慢性丙型肝炎。 同时,估计还有26800人在输血后感染了丙型肝炎,通常是在分娩、手术或事故后在医院接受的。 英国政府已经宣布了一项预计总额为100亿英镑(约合127亿美元)的赔偿方案,以纠正这一历史性错误。政府还承诺将为受影响的人建立一个专门的心理咨询服务,预计将在夏季晚些时候为首批患者提供支持。 此外,英国政府已经接受了独立人士Sir Robert Francis KC的建议,对赔偿方案进行了重大修改,包括为受感染者提供终身支持,并增加了一些领域的赔偿金额。 这场丑闻的受害者和他们的家庭长期以来一直在为官方的失败寻求正义和政府赔偿,他们的斗争终于得到了官方的认可和回应。

WordPress智能摘要插件

步骤 1:创建插件的基础文件 首先,在wp-content/plugins/目录下创建一个新文件夹,如chatglm-summary-plugin。然后在该文件夹中创建一个PHP文件,比如chatglm-summary-plugin.php。 步骤 2:编写插件的主文件 在chatglm-summary-plugin.php中,添加以下代码: 步骤 3:说明 步骤 4:安装和启用插件 将插件上传到WordPress的插件目录(wp-content/plugins/)后,在WordPress后台的插件页面中激活该插件。激活后,在“设置”菜单中会出现“ChatGLM Summary”选项,用户可以在那里输入ChatGLM的API密钥。 步骤 5:测试和调试 创建或编辑一篇文章并保存,查看文章开头是否成功插入了摘要。如果没有出现摘要,请检查API请求是否成功,以及API密钥是否正确。 这样,你就完成了一个简单的WordPress插件,它能够通过ChatGLM的API自动生成文章摘要并插入到文章的开头。

🚀 Go 1.23:对函数类型的范围迭代功能的探讨

在编程语言的演进中,Go 1.23 的发布为开发者们带来了一个令人振奋的新特性——对函数类型的范围迭代(range over function types)。这项功能不仅仅是语法上的增强,它将极大地简化用户自定义容器的迭代操作,让 Go 的容器处理变得更加一致和高效。本文将深入探讨这一新特性,分析其背景、实现及应用示例。 🔍 背景:为什么要引入这一特性? 自 Go 1.18 引入泛型以来,开发者们可以创建新型的泛型容器,例如集合(Set)。在处理这些容器时,如何有效地迭代其元素成为了一个亟待解决的问题。传统上,Go 中的迭代是通过 for/range 语句实现的,但这一语法仅限于内置的容器类型,如切片、数组和映射。随着自定义容器的出现,开发者不得不依赖不同的迭代机制,导致学习成本增加并且缺乏一致性。 引入对函数类型的范围迭代,旨在统一这一操作,使得开发者能够以更简洁的方式遍历自定义容器中的元素。 📦 新特性概述 在 Go 1.23 中,for/range 语句扩展到支持对函数类型的迭代。具体来说,它支持那些接受单个参数的函数,而这个参数本身是一个函数(yield function),后者可以接受零到两个参数并返回布尔值。例如,函数签名可能是: 这种新形式的迭代器使得开发者能够以标准化的方式访问容器的元素,从而提高代码的可读性和可维护性。 🎉 迭代器的实现 Go 1.23 中的迭代器分为两种:推送迭代器(push iterators)和拉取迭代器(pull iterators)。推送迭代器是指在调用时通过 yield 函数推送元素,而拉取迭代器则是通过每次调用拉取下一个元素。 以下是一个推送迭代器的简单实现示例,定义了一个集合(Set)类型: 在这个示例中,All 方法返回一个迭代器,允许使用 for/range 结构遍历集合中的所有元素。 🔄 拉取迭代器的使用 与推送迭代器不同,拉取迭代器在每次调用时返回下一个值。这里是一个拉取迭代器的实现示例: 使用拉取迭代器遍历集合元素的示例如下: 这种灵活性使得开发者能够方便地并行迭代多个容器。 🔗 适配器与标准库的增强 为了增强这一特性的灵活性和可用性,Go 标准库也进行了相应的扩展。例如,新的 slices 和 maps 包中引入了多个与迭代器相关的函数,如 slices.All … Read more

RAG 实现正变得更具代理特性

🌟 引言 随着生成性人工智能框架的不断进步,RAG(检索增强生成)实现正在朝着更具代理特性的方向演化。曾几何时,基本的 RAG 架构被视为足够,但如今,这一领域正通过融合更多智能和元素而发生显著变化。我们不禁要问,这种转变意味着什么?在探索这一问题的同时,我们将揭开 RAG 实现的潜在优势以及其面临的挑战。 🧐 标准 RAG 的问题 首先,RAG 架构中的提示结构日益重要。过去,仅仅将上下文数据注入提示中并不足以满足需求。如今,开发者们开始精心设计提示的措辞,以最大限度地优化性能。例如,Chain-of-Thought 技术的引入使得提示可以引导模型进行更复杂的推理。这一变化标志着从简单的文本输入到更复杂的多层次输入的转变。 其次,RAG 的静态特性使其在两个关键方面显得乏力。RAG 通常未能充分考虑对话的上下文,且其检索决策过程往往受限于静态规则,缺乏灵活性。想象一下,假设你在和一个机器人聊天,但它却只记得你刚刚说过的内容,而无法理解你先前提到的背景信息,这就像在与一个只会重复的录音机对话。 此外,关于不必要的开销问题也逐渐引起关注,特别是在未优化的检索和额外的文本中,导致了不必要的成本和推理延迟。多步骤方法和分类器被用于确定最佳响应,而这些分类器常常依赖于标注数据来训练特定任务的模型。这一现象在一定程度上暴露了标准 RAG 实现的局限性。 🔍 代理式 RAG 的崛起 随着对 RAG 方案不断深入的研究,出现了一种被称为“代理式 RAG”的新模式。在这种模式中,RAG 被实现为一种更具代理特性的方式。每个工具都与一个或一组文档相关联,代理能够根据文档的描述选择合适的工具。用户可以提交跨越多个文档的问题,代理则能综合不同工具的能力,给出更为精准的答案。 例如,设想一个 RAG 代理被要求计算一个公司在三个月内的利润(收入减去成本)。标准的 RAG 实现将无法处理这一复杂的用户请求,因为这需要跨越多个文档进行数据的综合与处理。而代理式 RAG 则能够将不同工具结合起来,以实现更复杂的计算和推理。 🛠️ 代理式 RAG 的架构 在 RAG 的代理式实现中,关键决策点在于三个方面:首先,了解何时以及从何处进行检索;其次,对检索到的数据进行评估、校正或至少进行某种质量检查;最后,生成后的检查也至关重要。在某些实现中,可能会运行多次生成,并选择最佳结果。此外,也有框架对生成结果进行真实性检查。 这种代理式架构的建立不仅提升了 RAG 的鲁棒性,还增强了其推理能力和智能性。通过将多个小型工人代理整合到一个更大的框架中,组织能够轻松扩展其代理系统,以适应不断变化的需求。 🚀 结论 随着 RAG 实现的不断演进,代理式 RAG 的模式无疑是这一发展过程中的自然进步。它展示了多代理协调的良好范例,也为 RAG 实现增添了更多活力与灵活性。未来,我们可以预见,代理式 … Read more

🧠 数据库:大型语言模型的象征性记忆

在人工智能的迅速发展中,大型语言模型(LLMs)如雨后春笋般涌现,成为自然语言处理(NLP)领域的中流砥柱。尽管这些模型在理解和生成上下文相关的响应方面取得了显著进展,但它们在处理复杂的多轮对话时却面临着不小的挑战。本文将探讨一种创新的框架——ChatDB,它通过将数据库作为象征性记忆,增强LLMs的推理能力。 🚀 引言:LLMs的局限性与挑战 随着GPT-4(OpenAI,2023)和PaLM 2(Anil et al.,2023)等模型的普及,LLMs在许多行业中展现出巨大的潜力。然而,LLMs的一个主要局限在于它们的上下文窗口大小。以GPT-4为例,它只能处理最多32,000个标记。在一系列多轮交互中,如何有效地保持上下文信息,成为了一个亟待解决的问题。简单地将所有上下文信息拼接在一起,容易导致模型失去对话的脉络,从而产生不准确的回答。 为了解决这一问题,研究者们探索了多种神经记忆机制(Wu et al.,2022a;Khattab et al.,2022;Zhong et al.,2022)。然而,这些传统的神经记忆机制在存储、检索和操控历史信息时常常表现不佳,特别是在需要复杂推理的任务中。主要原因在于它们无法以结构化的形式存储历史信息,而其对信息的操控也不是象征性的,容易导致错误的积累。 🏗️ ChatDB:象征性记忆的框架 为了克服上述问题,ChatDB框架应运而生。ChatDB的核心思想是将数据库作为LLMs的象征性记忆。该框架由两个主要组件组成:LLM控制器和存储历史信息的数据库。LLM控制器负责生成SQL指令,以便操控数据库。通过使用SQL语句,ChatDB能够以结构化的方式存储和操作历史信息,确保操作的精确性和效率。 在ChatDB中,研究者们提出了一种“记忆链”(Chain-of-Memory, CoM)的方法。这种方法将用户输入转化为一系列中间记忆操作步骤,进而得出最终结果。通过这种方法,复杂问题被拆解为多个简单的记忆操作步骤,从而显著降低了解题的复杂性。 🔗 记忆链的优势 记忆链的优势在于它能够增强LLMs在操控象征性记忆时的推理能力。通过将用户输入分解为一系列中间操作,LLMs能够更高效地处理象征性记忆。举例来说,当一个商店经理需要维护每日销售记录时,使用数据库作为外部象征性记忆就显得尤为重要,这种结构化的存储方式使得插入、更新、查询和删除操作变得高效而准确。 🧩 ChatDB的实验评估 通过一系列实验,研究者们验证了ChatDB在增强LLMs推理能力方面的有效性。在一个模拟的水果商店管理数据集上,ChatDB显著超过了传统的ChatGPT模型,尤其在处理复杂的多跳推理问题时,ChatDB展示了其卓越的能力。 在实验中,ChatDB使用了一个包含70条时间顺序记录的水果商店数据集。这些记录涵盖了采购、销售、价格变动和商品退货等常见操作,确保了所有历史记录的有效性。在回答问题时,ChatDB能够利用SQL语句进行一系列数据库查询,确保每一步的计算都准确无误,从而有效防止错误的积累。 📊 实验结果 实验结果展示了ChatDB在回答问题时的高准确性。具体而言,在50个问题的回答中,ChatDB在容易问题的正确回答率为13/15,而在困难问题的正确回答率则达到了28/35。相比之下,ChatGPT在困难问题上仅有1/35的正确率。这一结果清晰地表明,象征性记忆的使用不仅提高了LLMs的推理能力,也显著减少了由于错误积累导致的回答失误。 🌍 未来展望 ChatDB的提出为LLMs的发展开辟了新的思路。通过将数据库作为象征性记忆,LLMs不仅能够更好地处理复杂的推理任务,还能在实际应用中展现出更高的稳定性和准确性。未来的研究可以进一步探索如何将其他类型的结构化数据与LLMs结合,以实现更广泛的应用场景。 📚 参考文献

LLM驱动的智能体:构建智能未来的基石

近年来,人工智能领域取得了令人瞩目的进展,其中大型语言模型(LLM)的出现被认为是通向通用人工智能(AGI)的关键一步。LLM 拥有强大的语言理解和生成能力,为构建能够感知环境、做出决策并执行行动的智能体提供了坚实的基础。本文将深入探讨 LLM 驱动的智能体,从其构建、应用到社会模拟等方面展开论述。 1. 智能体的诞生:LLM 驱动的智能体构建 LLM 驱动的智能体通常由三个主要部分组成:大脑、感知和行动。 1.1 大脑:以 LLM 为核心 LLM 是智能体的大脑,赋予其强大的语言能力,使其能够理解和生成自然语言。 1.1.1 自然语言交互 LLM 在自然语言交互方面展现出卓越的能力,包括: 1.1.2 知识 LLM 的知识储备是其强大能力的基石,主要来源包括: 1.1.3 内存 LLM 的内存能力决定了其记忆和检索信息的能力。 1.1.4 推理与规划 LLM 的推理和规划能力是其解决复杂问题、制定行动计划的关键。 1.1.5 可迁移性和泛化性 LLM 的可迁移性和泛化性决定了其在不同任务和场景下的适应能力。 1.2 感知:多模态输入 LLM 驱动的智能体可以通过多模态感知,获取更丰富的信息。 1.2.1 视觉 LLM 可以理解和生成图像信息,例如,Images Speak in Images: A Generalist Painter for In-Context Visual Learning 提出了一个用于上下文视觉学习的通用模型 Painter。 … Read more