AGI
重温被 Mamba 带火的 SSM:线性系统和 HiPPO 矩阵
近年来,深度学习领域涌现出许多新的模型架构,其中状态空间模型 (SSM,State Space Model) 因其 ... 阅读更多
重温被 Mamba 带火的 SSM:线性系统和 HiPPO 矩阵
作者:苏剑林单位:科学空间研究方向:NLP 、神经网络 前几天,笔者看了几篇介绍 SSM(State Space ... 阅读更多
HiPPO 矩阵:打开序列模型记忆宝库的金钥匙
在人工智能领域,如何让机器像人一样拥有记忆,一直是科学家们孜孜以求的目标。近年来,序列模型 (SSM) 的兴起为解 ... 阅读更多
哄 AI 像哄小孩?一句 「咒语」 让 GPT-3 准确率暴涨 61%!
最近,机器学习界出现了一项令人震惊的研究成果:仅仅对 GPT-3 说一句 「让我们一步一步地思考」,就能让它解开之前 ... 阅读更多
基于 Agent 的大型语言模型:AI 智能体的新时代
近年来,大型语言模型 (LLM) 取得了令人瞩目的进展,展现出强大的语言理解和生成能力,被誉为通用人工智能 (AGI ... 阅读更多
大型语言模型的 「灾难性遗忘」:指令向量揭示真相,引导训练化解危机
大型语言模型 (LLM) 在自然语言处理领域取得了巨大成功,但它们在微调过程中容易出现 「灾难性遗忘」 问题,即模型在 ... 阅读更多
大模型的可控生成:CoDI-Eval 基准测试
近年来,大型语言模型 (LLM) 在理解和执行自然语言指令方面展现出惊人的能力,为自然语言处理领域带来了革命性的变 ... 阅读更多
为新闻推荐系统预训练词向量和实体向量
新闻推荐系统近年来发展迅速,其中一个重要的技术突破是深度知识感知网络 (DKN) 的出现。 DKN 能够利用知识 ... 阅读更多