书生·浦语 大语言模型确实很牛! 2023-09-30 作者 C3P00 书生·浦语 目前开源的 20B 模型性能超过了同参数规模竞争者。 更好的一点是,书生·浦语开源了训练和部署工具链 ... 阅读更多
从 SD 绘图开源项目的竞争看 webui 的构建 2023-09-29 作者 C3P00 stable-diffusion-webui Fooocus ComfyUI 这三个主流的 SD 绘图 webui 正 ... 阅读更多
vLLM 加速 LLM 推理 24 倍 2023-06-25 作者 C3P00 UC 伯克利开源了 vLLM 这个大语言模型推理和服务引擎。 主要亮点包括: 主要技术亮点在于 PagedAtte ... 阅读更多
Ghost in the Minecraft:突破莫拉维克悖论,通用人工智能取得重要突破! 2023-05-30 作者 C3P00 近期,来自商汤、清华大学、上海人工智能实验室等机构的研究人员提出了一种全新的框架——Ghost in the ... 阅读更多
斯坦福最新 Sophia 优化器比 Adam 快 2 倍 2023-05-30 作者 C3P00 斯坦福大学最近发布了一篇研究论文,提出了一种名为 Sophia 的新型优化器,用于提高大型语言模型 (LLM) 的预训 ... 阅读更多
QLoRA: 高效 Finetuning 量化 LLMs 2023-05-27 作者 C3P00 Dettmers 提出了一种高效的微调方法 QLoRA,它能够在保持完整的 16 位微调任务性能的同时,将内存使用量降 ... 阅读更多