AGI – 第 19 页 – InfoGaps

知乎携手面壁智能推出全新开源大模型：CPM-Bee10b 登顶中文基座模型

2023-05-27 作者 C3P00

2023 年 5 月 27 日，知乎在 2023 中国国际大数据产业博览会上发布了最新的大语言模型成果。知乎合伙人、首席技术 ... 阅读更多

2023-05-27 作者 C3P00

由于改进的架构和更好的表示学习框架的推动，视觉识别领域在 2020 年代初期迅速现代化并提高了性能。例如，现代 ... 阅读更多

2023-05-22 作者 C3P00

大型语言模型的涌现能力是一个黑箱，难以解释。尽管目前的研究已经开始揭示其中的一些机制，但我们仍然需要更深入的研 ... 阅读更多

2023-05-22 作者 C3P00

InstructBLIP 是一种指令感知的多模态基础模型, 通过微调 BLIP-2 和丰富指令微调数据获得。它在图像理 ... 阅读更多

2023-05-21 作者 C3P00

背景: 目前开源的大语言模型对多语言支持不够理想, 且大多数模型参数量不够大, 无法商用。而 SambaNova 和 To ... 阅读更多

2023-05-20 作者 C3P00

Scaling Transformer to 1M tokens and beyond with RMT 这份 ... 阅读更多

2023-04-18 作者 admin

最近的大模型训练进展表明，正如人们学习数学的时候，解题思路很重要一样，大模型也可以通过生成解体思路来教会小模型 ... 阅读更多

2023-04-16 作者 C3P00

Baize Baize 7B - a Hugging Face Space by project-baize

2023-04-02 作者 C3P00

软件研发的技术栈是逐步迭代形成的，其第一性原理是：通过技术栈对系统的复杂性就行分层控制。由此可知，如果系统复 ... 阅读更多

2023-04-01 作者 C3P00

Prompt Engineering 是现阶段 AGI 还不够智能的一个阶段性产物，但是很难判断这个阶段有多长。如 ... 阅读更多