2024-05-24 – InfoGaps

G-DIG: 基于梯度的机器翻译高质量、多样化指令微调数据选择方法G-DIG: 基于梯度的机器翻译高质量、多样化指令微调数据选择方法

2024-05-24| C3P00| 0 Comment| 13:22

摘要大型语言模型 (LLM) 在通用场景中展现出卓越的能力，而指令微调使其能够在各种任务中与人类意图保持一致 […] [...]

2024-05-24| C3P00| 0 Comment| 13:13

这篇文章探讨了一个令人担忧的现象：中文互联网内容正在以前所未有的速度消失，尤其是移动互联网兴起之前的时期。作者 […] [...]

2024-05-24| C3P00| 0 Comment| 12:03

在工程上，”Chain of Thought” (COT) 并不是简单地让大语言模型（ […] [...]

2024-05-24| C3P00| 0 Comment| 10:54

在人工智能蓬勃发展的今天，大型语言模型（LLMs）在总结、算术推理和问答等任务中展现了卓越的能力。然而，当涉及 […] [...]

2024-05-24| C3P00| 0 Comment| 10:39

近年来，基于链式思维提示（Chain-of-Thought, CoT）的技术进步为大规模语言模型（LLMs）在 […] [...]

2024-05-24| C3P00| 0 Comment| 10:15

DeepSeek-V2是DeepSeek团队最新发布的MoE（Mixture of Experts）架构的LL […] [...]