跳至内容

InfoGaps | 信息差

  • Forum
  • Friends
  • Join
  • About

ConvNeXt V2:使用遮罩自编码器共同设计和扩展 ConvNets

2023-05-27 作者 C3P00

由于改进的架构和更好的表示学习框架的推动,视觉识别领域在 2020 年代初期迅速现代化并提高了性能。例如,现代 ... 阅读更多

分类 AGI 标签 AGI 、 AI 2 条评论

大模型能力的 「涌现」 机制被谷歌发现

2023-05-22 作者 C3P00

大型语言模型的涌现能力是一个黑箱,难以解释。尽管目前的研究已经开始揭示其中的一些机制,但我们仍然需要更深入的研 ... 阅读更多

分类 AGI 标签 AGI 7 条评论

InstructBLIP 抢跑看图聊天,开源项目横扫多项 SOTA

2023-05-22 作者 C3P00

InstructBLIP 是一种指令感知的多模态基础模型, 通过微调 BLIP-2 和丰富指令微调数据获得。它在图像理 ... 阅读更多

分类 AGI 标签 AGI 发表评论

BLOOMChat: 开源可商用支持多语言的大语言模型,性能逼近 GPT-4!

2023-05-21 作者 C3P00

背景: 目前开源的大语言模型对多语言支持不够理想, 且大多数模型参数量不够大, 无法商用。而 SambaNova 和 To ... 阅读更多

分类 AGI 标签 AGI 5 条评论

RMT 突破 LLM 百万 Tokens 上下文长度

2023-05-20 作者 C3P00

Scaling Transformer to 1M tokens and beyond with RMT 这份 ... 阅读更多

分类 AGI 标签 AGI 、 AI 7 条评论

AGI 将复活互联网精神

2023-05-19 作者 C3P00

移动互联网的 App 时代,导致了信息的孤岛化。一个个超级 App,想将自己打造成综合体,用户无论需要什么,都可以不 ... 阅读更多

分类 AGI 2 条评论

RWKV 模型

2023-05-17 作者 C3P00

RWKV-LM 是一个开源的 LLM,作者是 PENG Bo 。 论文:RWKV: Reinventing RNN ... 阅读更多

分类 AGI 23 条评论

常见设备算力对照表

2023-05-17 作者 C3P00
分类 硬件设备 1 条评论

思维链 -- 展现解题过程的重要性

2023-04-18 作者 小邮差

最近的大模型训练进展表明,正如人们学习数学的时候,解题思路很重要一样,大模型也可以通过生成解体思路来教会小模型 ... 阅读更多

分类 AGI 标签 AGI 、 AI 3 条评论

AI 聊天机器人

2023-04-16 作者 C3P00

Baize Baize 7B - a Hugging Face Space by project-baize

分类 AGI 标签 AGI 、 AI 发表评论
较早文章
较新文章
← 上一页 页面 1 … 页面 140 页面 141 页面 142 下一页 →

Recent Posts

  • 2025 年 12 月 2 日,美国众议院筹款委员会监督小组委员会举行听证会,主题为 「生命危在旦夕:追究免税器官获取组织责任」(Lives at Stake: Holding Tax-Exempt Organ Procurement Organizations Accountable)
  • 美国会调查新泽西器官获取丑闻:X 平台上的愤怒回响与举报人呐喊
  • New Jersey organ procurement organization under congressional investigation after 『alarming』 whistleblower claims
  • 美国过去五年里至少有 2 万名有生还希望的美国人被故意活活杀死了
  • 活摘的幽灵:当器官捐献变成致命的交易

Recent Comments

  1. 小邮差 发表在 PHP 8.3 @ Ubuntu 无法开启 JIT 的问题
  2. C3P00 发表在 RWKV-5 详细解析:理解并行训练的 RNN 网络
  3. C3P00 发表在 【重磅】 从 RAG 到 Self-RAG:LLM 的知识增强
  4. C3P00 发表在 🔑 密码的终结者:WebAuthn API 深度解析
  5. C3P00 发表在 英特尔重拳出击:全新"纯大核"处理器或将改变市场格局
© 2025 InfoGaps | 信息差 • Built with GeneratePress