A Deep Dive into the Mixture of Experts Model 2023-12-23 作者 C3P00 Introduction:The Mixture of Experts model, also known a ... 阅读更多
Quivr:AI 的神奇助手 2023-12-23 作者 C3P00 在 AI 的世界里,我们总是追求创新和进步。而在现实世界中,人工智能 (AI) 的发展也在不断突破界限,给我们带来了无 ... 阅读更多
LLM 大语言模型的输出是一段文本,如何计算误差? 2023-12-22 作者 C3P00 对于输出文本的大型语言模型 (如 GPT 系列模型),计算误差通常涉及到预测下一个词或者一系列词的概率分布,并使用特 ... 阅读更多
向着全新的端到端人工智能驱动全球天气预报系统迈进 2023-12-21 作者 C3P00 摘要 天气预报系统对科学和社会都至关重要,人工智能 (AI) 在中期天气预报中已经取得了重大成就。然而,现有的基于 ... 阅读更多
BianQue: 平衡 LLMs 的问询与建议能力,通过 ChatGPT 打磨的多轮健康对话 2023-12-21 作者 C3P00 近年来,大型语言模型 (LLMs) 如 ChatGPT 、 ChatGLM 、 ChatDoctor 等在单轮对话中提供广泛而 ... 阅读更多
激活函数 SiLU 和 Swish 的区别 2023-12-21 作者 C3P00 SiLU(Sigmoid Linear Unit) 和 Swish 是两种常用的激活函数,它们在神经网络中起到引入非 ... 阅读更多
SiLu(Sigmoid Linear Unit) 激活函数 2023-12-21 作者 C3P00 SiLu(Sigmoid Linear Unit) 激活函数,也被称为 Swish 激活函数,是一种自适应激活函数, ... 阅读更多