Bitune:双向指令调优技术及其在大型语言模型中的应用 2024-05-25 作者 C3P00 在人工智能的发展历程中,语言模型的进步尤为引人注目。特别是在自然语言处理领域,大型语言模型 (LLMs) 已经成为 ... 阅读更多
人工智能如何模拟人类思维:跨领域映射研究揭示的启示 2024-05-25 作者 C3P00 在人类的认知科学中,理解抽象和具体概念是一个长期而复杂的议题。最近,由耶路撒冷希伯来大学的研究团队进行的一项研 ... 阅读更多
游戏卡顿的救星?深度解析 CPU 缓存为何如此重要! 2024-05-25 作者 C3P00 你是否也曾体验过在酣畅淋漓的游戏过程中,画面突然卡顿,操作延迟甚至出现撕裂?这种糟糕的体验足以让任何玩家抓狂。 ... 阅读更多
G-DIG: 基于梯度的机器翻译高质量、多样化指令微调数据选择方法 2024-05-24 作者 C3P00 摘要 大型语言模型 (LLM) 在通用场景中展现出卓越的能力,而指令微调使其能够在各种任务中与人类意图保持一致 ... 阅读更多
中文互联网正在加速崩塌:一场关于记忆与遗忘的数字浩劫 2024-05-24 作者 C3P00 这篇文章探讨了一个令人担忧的现象:中文互联网内容正在以前所未有的速度消失,尤其是移动互联网兴起之前的时期。作者 ... 阅读更多
在工程上,"Chain of Thought" (COT) 并不是简单地让大语言模型 (LLM) 多看几遍题目来回答 2024-05-24 作者 C3P00 在工程上,"Chain of Thought" (COT) 并不是简单地让大语言模型 (LLM) 多看几遍题目并综 ... 阅读更多
赋予大模型道德决策能力:Skin-in-the-Game 框架 2024-05-24 作者 C3P00 在人工智能蓬勃发展的今天,大型语言模型 (LLMs) 在总结、算术推理和问答等任务中展现了卓越的能力。然而,当涉及 ... 阅读更多
打破瓶颈:一种层次化框架优化大规模语言模型的答案选择 2024-05-24 作者 C3P00 近年来,基于链式思维提示 (Chain-of-Thought, CoT) 的技术进步为大规模语言模型 (LLMs) 在 ... 阅读更多