基于 Agent 的大型语言模型:AI 智能体的新时代 2024-06-21 作者 C3P00 近年来,大型语言模型 (LLM) 取得了令人瞩目的进展,展现出强大的语言理解和生成能力,被誉为通用人工智能 (AGI ... 阅读更多
大型语言模型的 「灾难性遗忘」:指令向量揭示真相,引导训练化解危机 2024-06-21 作者 C3P00 大型语言模型 (LLM) 在自然语言处理领域取得了巨大成功,但它们在微调过程中容易出现 「灾难性遗忘」 问题,即模型在 ... 阅读更多
大模型的可控生成:CoDI-Eval 基准测试 2024-06-21 作者 C3P00 近年来,大型语言模型 (LLM) 在理解和执行自然语言指令方面展现出惊人的能力,为自然语言处理领域带来了革命性的变 ... 阅读更多
为新闻推荐系统预训练词向量和实体向量 2024-06-18 作者 C3P00 新闻推荐系统近年来发展迅速,其中一个重要的技术突破是深度知识感知网络 (DKN) 的出现。 DKN 能够利用知识 ... 阅读更多
沙特阿拉伯加入 mBridge 项目 2024-06-15 作者 C3P00 沙特阿拉伯加入 mBridge 项目,这是一个由国际清算银行 (BIS) 和中国牵头成立的央行数字货币 (CBDC) 跨境 ... 阅读更多
赋予对话系统 「大脑」:从神经科学到虚拟接待员 2024-06-15 作者 C3P00 随着聊天机器人、语言模型和语音技术的快速发展,人们越来越渴望创造能够通过自然语言或直接语音与人类无缝交互的系统 ... 阅读更多
MMLU:我们真的完成了它吗? 2024-06-08 作者 C3P00 大型语言模型 (LLM) 的出现,标志着自然语言处理领域取得了重大进展,使我们能够通过自然语言与计算机进行交互。然 ... 阅读更多
技术封建主义:互联网时代的 「数字农奴」? 2024-06-08 作者 C3P00 你是否以为,人类正在进入一个新时代——互联网高科技的时代? 2024 年出版的新书 《技术封建主义》 (Techno ... 阅读更多
DJL Serving: 轻松部署你的深度学习模型 2024-06-07 作者 C3P00 你是否还在为如何将训练好的深度学习模型部署到生产环境而烦恼?传统的部署方式往往需要复杂的配置和维护,而且难以扩 ... 阅读更多
用 Java 玩转深度学习:DJL 实战指南 2024-06-07 作者 C3P00 深度学习模型大多用 Python 开发,而服务端却多用 Java,导致许多开发者不得不使用 Java 调用 Python 接 ... 阅读更多
FedMoE:数据级个性化与混合专家,助力模型异构个性化联邦学习 2024-06-07 作者 C3P00 近年来,大型语言模型 (LLM) 的快速发展,如 ChatGPT 和 AIGC,让人们看到了人工智能的巨大潜力。然 ... 阅读更多