跳至内容

InfoGaps | 信息差

  • Forum
  • Friends
  • Join
  • About

探索人工智能——Zephyr 7B Beta 与 GGUF 的奇妙之旅🚀

2023-11-26 作者 C3P00

我们的主角是 Zephyr 7B Beta 和 GGUF,它们都是我们这个广阔世界中的一颗璀璨星辰。🌟 Zephyr ... 阅读更多

分类 AGI 1 条评论

Anima—开源的 33B 中文大型语言模型

2023-11-26 作者 C3P00
分类 AGI 发表评论

ICL vs Fine-tuning:迁移学习中的两种方法

2023-11-23 作者 C3P00

导语:迁移学习是机器学习领域中的一个重要概念,它可以将在一个任务上学到的知识迁移到另一个任务上。在迁移学习中, ... 阅读更多

分类 AGI 发表评论

Monarch Mixer: 重新审视 BERT,无需注意力机制或多层感知器

2023-11-23 作者 C3P00

引言:近年来,Transformer 模型在自然语言处理和计算机视觉等领域取得了巨大成功。然而,我们是否只有 Tr ... 阅读更多

分类 AGI 发表评论

QLoRA: 高效微调大型语言模型的利器

2023-11-23 作者 C3P00

引言:在机器学习领域,大型语言模型 (LLM) 是当前热门话题。想象一下,你是一名机器学习工程师,你的公司拥有 GP ... 阅读更多

分类 AGI 发表评论

Embroid: 无标签纠正和改进语言模型预测

2023-11-23 作者 C3P00

在最近的研究中,一项名为"Embroid"的新技术引起了广泛关注。这项技术可以在没有标签的情况下,对大型语言模 ... 阅读更多

分类 AGI 发表评论

Embroid: 无标签纠正和改进 LLM 预测

2023-11-23 作者 C3P00

近年来,人工智能领域取得了巨大的进展,其中包括了语言模型的发展。语言模型是一种能够理解和生成自然语言的模型,如 ... 阅读更多

分类 AGI 发表评论

Embroid:无需标签纠正和改进 LLM 预测

2023-11-23 作者 C3P00

导语:在人工智能领域,研究人员一直在探索如何提高预测模型的准确性。最近,斯坦福大学、 Anthropic 和威斯康 ... 阅读更多

分类 AGI 发表评论

FlashFFTConv:使用张量核心进行长序列高效卷积

2023-11-23 作者 C3P00

导语:本文将详细解析 FlashFFTConv,一种使用张量核心进行长序列高效卷积的算法。我们将介绍 FlashF ... 阅读更多

分类 AGI 发表评论

简单长卷积用于序列建模的详细解析

2023-11-23 作者 C3P00

在序列建模中,我们一直在研究如何获得良好的性能,并开发了新的系统技术和深度学习架构。今天,我们将介绍一个简单的 ... 阅读更多

分类 AGI 发表评论
较早文章
较新文章
← 上一页 页面 1 … 页面 115 页面 116 页面 117 … 页面 126 下一页 →

Recent Posts

  • TunGo - GOST 的 TUN2SOCKS 实现详解
  • 40 份市售预制菜包装袋溶剂残留检出率 100%
  • 清朝文化控制政策:焚书与 《四库全书》 的愚民统治体系
  • 🌌 从打工到自由:赚钱效率的系统博弈
  • 香烟的秘密契约:从一根烟到国家货币的稳定之谜

Recent Comments

  1. admin 发表在 PHP 8.3 @ Ubuntu 无法开启 JIT 的问题
  2. C3P00 发表在 RWKV-5 详细解析:理解并行训练的 RNN 网络
  3. C3P00 发表在 【重磅】 从 RAG 到 Self-RAG:LLM 的知识增强
  4. C3P00 发表在 🔑 密码的终结者:WebAuthn API 深度解析
  5. C3P00 发表在 英特尔重拳出击:全新"纯大核"处理器或将改变市场格局
© 2025 InfoGaps | 信息差 • Built with GeneratePress