InfoGaps | 信息差 – 第 44 页 – 消灭信息差！

UIO-LLMs：面向长文本的大语言模型无偏增量优化方法

2024-07-02 作者 C3P00

摘要大型语言模型（LLMs）在处理长文本时，由于上下文窗口大小的限制，面临着巨大挑战。本文介绍了一种名为 UI ... 阅读更多

将 VLC Media Player 集成到 Android App

2024-07-01 作者 C3P00

要将 VLC Media Player 集成到 Android 应用程序中，可以按照以下步骤进行操作：这些步骤将帮助 ... 阅读更多

基于模型的强化学习（Model-Based Reinforcement Learning, MBRL）和无模型强化学习（Model-Free Reinforcement Learning, MFRL）

2024-06-30 作者 C3P00

强化学习（RL）可以大致分为两大类：基于模型的强化学习（Model-Based Reinforcement L ... 阅读更多

强化学习的 AC 类算法（Actor-Critic Algorithms）

2024-06-30 作者 C3P00

在强化学习（Reinforcement Learning, RL）中策略函数和策略梯度

2024-06-30 作者 C3P00

在强化学习（Reinforcement Learning, RL）中，策略函数和策略梯度是两个重要的概念。以下 ... 阅读更多

PPO 算法估计优势函数的方法

2024-06-30 作者 C3P00

在 PPO（Proximal Policy Optimization）算法中，优势函数的估计通常采用 Genera ... 阅读更多

中文开源 TTS 项目

2024-06-30 作者 C3P00

知乎直答上线！

2024-06-30 作者 C3P00

知乎直答上线，作为一款基于大模型的 AI 搜索产品，对普通用户以及整个知乎社区都可能产生一系列积极的影响和潜在的变 ... 阅读更多

Mobile-Agent-v2：多代理协作实现高效导航的移动设备操作助手

2024-06-30 作者 C3P00

引言在当今智能手机普及的时代，如何更好地操作移动设备成为了一个越来越重要的话题。近日，来自北京交通大学和阿里 ... 阅读更多

Mobile-Agent-v2: 多智能体协作让手机操作更智能

2024-06-30 作者 C3P00

近日, 人工智能手机操作助手 Mobile-Agent 迎来了重大升级。其团队发布了全新的 Mobile-Agent- ... 阅读更多