跳至内容

InfoGaps | 信息差

  • Forum
  • Friends
  • Join
  • About

斯坦福最新 Sophia 优化器比 Adam 快 2 倍

2023-05-30 作者 C3P00

斯坦福大学最近发布了一篇研究论文,提出了一种名为 Sophia 的新型优化器,用于提高大型语言模型 (LLM) 的预训 ... 阅读更多

分类 AGI 发表评论

QLoRA: 高效 Finetuning 量化 LLMs

2023-05-27 作者 C3P00

Dettmers 提出了一种高效的微调方法 QLoRA,它能够在保持完整的 16 位微调任务性能的同时,将内存使用量降 ... 阅读更多

分类 AGI 标签 AGI 、 AI 10 条评论

VanillaNet: 极简主义的力量

2023-05-27 作者 C3P00

最近,一篇名为 《VanillaNet: the Power of Minimalism in Deep Lea ... 阅读更多

分类 AGI 1 条评论

知乎携手面壁智能推出全新开源大模型:CPM-Bee10b 登顶中文基座模型

2023-05-27 作者 C3P00

2023 年 5 月 27 日,知乎在 2023 中国国际大数据产业博览会上发布了最新的大语言模型成果。知乎合伙人、首席技术 ... 阅读更多

分类 AGI 标签 AGI 、 AI 、 中文 发表评论

ConvNeXt V2:使用遮罩自编码器共同设计和扩展 ConvNets

2023-05-27 作者 C3P00

由于改进的架构和更好的表示学习框架的推动,视觉识别领域在 2020 年代初期迅速现代化并提高了性能。例如,现代 ... 阅读更多

分类 AGI 标签 AGI 、 AI 2 条评论

大模型能力的 「涌现」 机制被谷歌发现

2023-05-22 作者 C3P00

大型语言模型的涌现能力是一个黑箱,难以解释。尽管目前的研究已经开始揭示其中的一些机制,但我们仍然需要更深入的研 ... 阅读更多

分类 AGI 标签 AGI 7 条评论

InstructBLIP 抢跑看图聊天,开源项目横扫多项 SOTA

2023-05-22 作者 C3P00

InstructBLIP 是一种指令感知的多模态基础模型, 通过微调 BLIP-2 和丰富指令微调数据获得。它在图像理 ... 阅读更多

分类 AGI 标签 AGI 发表评论

BLOOMChat: 开源可商用支持多语言的大语言模型,性能逼近 GPT-4!

2023-05-21 作者 C3P00

背景: 目前开源的大语言模型对多语言支持不够理想, 且大多数模型参数量不够大, 无法商用。而 SambaNova 和 To ... 阅读更多

分类 AGI 标签 AGI 5 条评论

RMT 突破 LLM 百万 Tokens 上下文长度

2023-05-20 作者 C3P00

Scaling Transformer to 1M tokens and beyond with RMT 这份 ... 阅读更多

分类 AGI 标签 AGI 、 AI 7 条评论

AGI 将复活互联网精神

2023-05-19 作者 C3P00

移动互联网的 App 时代,导致了信息的孤岛化。一个个超级 App,想将自己打造成综合体,用户无论需要什么,都可以不 ... 阅读更多

分类 AGI 2 条评论

RWKV 模型

2023-05-17 作者 C3P00

RWKV-LM 是一个开源的 LLM,作者是 PENG Bo 。 论文:RWKV: Reinventing RNN ... 阅读更多

分类 AGI 23 条评论

常见设备算力对照表

2023-05-17 作者 C3P00

PV: 0

分类 硬件设备 1 条评论
较早文章
较新文章
← 上一页 页面 1 … 页面 178 页面 179 页面 180 下一页 →

Recent Posts

  • 镜花水月一场空:大 S 的离去,撕开了人生最残酷的真相
  • 大 s 的死,让我们看清了什么?
  • 准格尔人是不是大明遗民?清准战争是不是,明清最后一战?
  • 当初是怎么被高晓松这样的公知迷惑的?你们现在怎么看待这个人?
  • 如何评价西欧各族群的朊病毒抗性远高于汉族人?

Recent Comments

  1. 宁波健康婴儿被医生做手术致死案 – InfoGaps | 信息差 发表在 柬埔寨婴儿活体干细胞丑闻
  2. 柬埔寨婴儿活体干细胞丑闻 – InfoGaps | 信息差 发表在 🩸 手术台上的幽灵:刘翔峰的 「替罪羊」 面纱与罗帅宇的坠楼黑洞——湘雅二院的深渊回响
  3. 小邮差 发表在 咕咚一声,华夏沉海:癸酉本 〈红楼梦〉 的千年一叹
  4. 小邮差 发表在 咕咚一声,华夏沉海:癸酉本 〈红楼梦〉 的千年一叹
  5. 小邮差 发表在 PHP 8.3 @ Ubuntu 无法开启 JIT 的问题

Archives

  • 2026 年 1 月
  • 2025 年 12 月
  • 2025 年 11 月
  • 2025 年 9 月
  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 4 月
  • 2024 年 9 月
  • 2024 年 8 月
  • 2024 年 7 月
  • 2024 年 6 月
  • 2024 年 5 月
  • 2024 年 4 月
  • 2024 年 1 月
  • 2023 年 12 月
  • 2023 年 11 月
  • 2023 年 10 月
  • 2023 年 9 月
  • 2023 年 6 月
  • 2023 年 5 月
  • 2023 年 4 月
  • 2023 年 3 月

Categories

  • AGI
  • AI
  • CPU
  • GPU
  • Uncategorized
  • 人物志
  • 信息差
  • 军事
  • 加密货币
  • 历史
  • 商业
  • 安全和内幕
  • 市场和投资
  • 心理学
  • 政治
  • 教材
  • 教育
  • 教育与考试
  • 文明和冲突
  • 架构师
  • 爱与情感
  • 男女关系
  • 硬件设备
  • 科学
  • 算法
  • 经济
  • 统治与剥削
  • 网络
  • 英语
  • 资讯
  • 软件
  • 黑幕
© 2026 InfoGaps | 信息差 • Built with GeneratePress