面壁智能发布 Eurux-8x22 开源大模型:代码性能超越 Llama3-7

品玩5月6日讯,面壁智能官方消息,面壁智能近日发布开源大模型 Eurux-8x22B,包括Eurux-8x22B-NCA 与Eurux-8x22B-KTO,主打推理能力。

Eurux-8x22B在 LeetCode(180 道 LeetCode 编程真题)与 TheoremQA 测试上超越了 Llama3-70B,在 LeetCode 测试上超越闭源的 GPT-3.5-Turbo。

据介绍,Eurux-8x22B 模型激活参数 39B,支持 64k 上下文,是由 Mixtral-8x22B 模型对齐而来,在 UltraInteract 对齐数据集上训练而成。

图片[1]-面壁智能发布 Eurux-8x22 开源大模型:代码性能超越 Llama3-7-趣考网

本文来源于MSN作者:品玩快讯,文中观点仅代表作者本人,本站仅供信息存储

© 版权声明
THE END
喜欢就支持一下吧
点赞6 分享