2023 年 5 月 27 日,知乎在 2023 中国国际大数据产业博览会上发布了最新的大语言模型成果。知乎合伙人、首席技术官李大海宣布,知乎和面壁智能共同研发的中文基座大模型 CPM-Bee10b 全面开源,并发布了智能大模型产品 「露卡」 和知乎大模型应用功能 「搜索聚合卡」 。李大海表示,知乎将携手面壁智能,让中国用户在大模型时代享受到最优质的服务。
知乎与面壁智能首度合作,推出开源大模型 CPM-Bee10b
在 「2023 知乎发现大会」 上,知乎发布了大语言模型 「知海图 AI」 并内测首个站内大模型应用功能 「热榜摘要」 。此举令知乎成为国内首批具备大语言模型能力的公司,并且让更多人开始关注知乎的技术发展。时隔一个月之后,知乎在 2023 数博会上再度带来惊喜。
知乎联合面壁智能发布了首个开源中英文基座大模型 CPM-Bee 10b 。李大海介绍,该模型从零开始自主训练,基于 Transformer 架构,中英双语表现优秀,拥有百亿量级参数、超过 3 万亿高质量语料。经过 ZeroCLUE 的评测,CPM-Bee10b 以平均 79.8 分登顶中文基座模型,并且英文基座模型得到了 68 的平均分。 「CPM-Bee10b 将全面开源,并允许商用。」 李大海称,面壁智能一直坚持开源路线,未来也会持续拥抱开源,促进大模型领域技术和生态的繁荣。
智能大模型产品 「露卡」 亮相,展现全面性能
发布会上,知乎还带了最新的智能大模型产品 「露卡」(Luca) 。该产品在开源基础模型上又有进一步性能提升,可以进行智能交互并支持多轮对话。从评测结果来看,有 65% 的结果性能等于或优于 ChatGPT 。在发布会现场演示中,「露卡」 既展示了写文案、藏头诗、解数学题等 「全科」 能力,也能完成例如 「如何制作毛血旺」 等回答。令人惊喜的是,「露卡」 还拥有图片理解能力,甚至可以查找论文并生成摘要,这表明 「露卡」 拥有非常优秀的多模态理解能力。
知乎推出大模型应用功能 「搜索聚合卡」,助力用户高效获取信息
除了基础能力,知乎也是国内率先在应用层面探索大模型产品的公司。继 「热榜摘要」 之后,知乎带来了又一款站内的大模型应用功能 「搜索聚合」 。该产品将大模型能力应用到了知乎搜索上,每当用户触发搜索时,系统就会从大量提问和回答中聚合观点,提高用户获取信息、形成决策的效率。发布会当天,「露卡」 和 「搜索聚合」 都开启了正式内测。李大海表示,知乎将继续夯实大模型基础能力,迭代应用产品,为让中国用户享受到一流的大模型服务而努力奋斗。
未来展望:知乎致力于为用户提供一流的大模型服务
本次发布会标志着知乎在大模型领域的技术实力再次得到了充分展示,同时也展现出知乎在人工智能领域的技术积累和创新能力。在与面壁智能的合作中,双方共同推进了大模型的研发,为中国用户带来了更多优质的服务。
未来,知乎将继续加强与各方的合作,进一步拓展大模型在实际应用中的价值。通过不断优化和升级大模型技术,以及与实际场景相结合的应用产品,知乎将努力成为大模型领域的引领者,让更多用户在大模型时代享受到一流的服务。