跳至内容

InfoGaps | 信息差

  • Forum
  • Friends
  • Join
  • About

C3P00

vLLM 加速LLM推理24倍

2023-06-25 作者 C3P00

UC伯克利开源了 vLLM 这个大语言模型推理和服务引擎。 主要亮点包括: 主要技术亮点在于PagedAtte … 阅读更多

分类 AGI 1 条评论

平均帧率稳定,但是掉帧的问题

2023-06-03 作者 C3P00

解决方案:

分类 GPU、 硬件设备 标签 GPU 发表评论

Ghost in the Minecraft:突破莫拉维克悖论,通用人工智能取得重要突破!

2023-05-30 作者 C3P00

近期,来自商汤、清华大学、上海人工智能实验室等机构的研究人员提出了一种全新的框架——Ghost in the … 阅读更多

分类 AGI 1 条评论

GPT的运用和训练

2023-05-30 作者 C3P00

对GPT的运用和训练,这里给出以下几点总结: GPT已经非常强大了,但仍存在诸多局限。合理使用与人工相结合是目 … 阅读更多

分类 AGI 发表评论

斯坦福最新Sophia优化器比Adam快2倍

2023-05-30 作者 C3P00

斯坦福大学最近发布了一篇研究论文,提出了一种名为Sophia的新型优化器,用于提高大型语言模型(LLM)的预训 … 阅读更多

分类 AGI 发表评论

QLoRA: 高效Finetuning 量化 LLMs

2023-05-27 作者 C3P00

Dettmers提出了一种高效的微调方法QLoRA,它能够在保持完整的16位微调任务性能的同时,将内存使用量降 … 阅读更多

分类 AGI 标签 AGI、 AI 10 条评论

VanillaNet: 极简主义的力量

2023-05-27 作者 C3P00

最近,一篇名为《VanillaNet: the Power of Minimalism in Deep Lea … 阅读更多

分类 AGI 1 条评论

知乎携手面壁智能推出全新开源大模型:CPM-Bee10b 登顶中文基座模型

2023-05-27 作者 C3P00

2023年5月27日,知乎在2023中国国际大数据产业博览会上发布了最新的大语言模型成果。知乎合伙人、首席技术 … 阅读更多

分类 AGI 标签 AGI、 AI、 中文 发表评论

ConvNeXt V2:使用遮罩自编码器共同设计和扩展ConvNets

2023-05-27 作者 C3P00

由于改进的架构和更好的表示学习框架的推动,视觉识别领域在 2020 年代初期迅速现代化并提高了性能。例如,现代 … 阅读更多

分类 AGI 标签 AGI、 AI 2 条评论

大模型能力的“涌现”机制被谷歌发现

2023-05-22 作者 C3P00

大型语言模型的涌现能力是一个黑箱,难以解释。尽管目前的研究已经开始揭示其中的一些机制,但我们仍然需要更深入的研 … 阅读更多

分类 AGI 标签 AGI 7 条评论
较早文章
较新文章
← 上一页 页面1 … 页面113 页面114 页面115 页面116 下一页 →

Recent Posts

  • IPFS Image Block Widget
  • Numba:为Python数值计算插上翅膀的JIT编译器
  • AI代理上下文工程:Manus经验应用于企业级知识问答系统
  • Qualcomm Snapdragon X Elite 2:下一代SoC革命
  • 【智能记忆学习材料】Comparing Apples to Oranges: A Dataset & Analysis of LLM Humour Understanding from Traditional Puns to Topical Jokes.

Recent Comments

  1. admin 发表在 PHP 8.3 @ Ubuntu 无法开启JIT的问题
  2. C3P00 发表在 RWKV-5详细解析:理解并行训练的RNN网络
  3. C3P00 发表在 【重磅】从 RAG 到 Self-RAG:LLM 的知识增强
  4. C3P00 发表在 🔑 密码的终结者:WebAuthn API 深度解析
  5. C3P00 发表在 英特尔重拳出击:全新”纯大核”处理器或将改变市场格局
© 2025 InfoGaps | 信息差 • Built with GeneratePress