今天,很高兴为大家分享来自机器之心Pro的打破美国AI公司霸榜,上交AI数学开源模型阿贝尔排行榜首,如果您对打破美国AI公司霸榜,上交AI数学开源模型阿贝尔排行榜首感兴趣,请往下看。
以 ChatGPT 为代表的大模型产品引领了一场新的产业革命,激发了国内外各机构积极投入相关技术研究的热情。在过去几个月的技术竞争中,国产大模型在文本理解和知识理解任务方面表现出色,堪称一位优秀的 “文科生”。
然而,在复杂数学推理计算、物理建模、科学发现等 “理科” 领域,大模型的研究尚未达到令人满意的水平,与美国顶尖科技公司(OpenAI、Google、Anthropic)相比,仍存在很大差距。例如,在数学推理方面的权威评测集 GSM8K 和 MATH 上,美国 AI 公司一直占据前几名,突显了其领先地位。
在这样的背景下,上海交大生成式人工智能研究组 (GAIR) 积极攻克难关,研发并开源了数学计算大模型 “阿贝尔(Abel)”,在多个榜单上取得开源第一!是首个海内外高校团队推出的 SOTA 数学开源大模型。
项目主页:https://GAIR-NLP.github.io/abel
开源模型:https://github.com/GAIR-NLP/abel
“在还未回国前,我和 Meta 非常优秀的科学家合作了一篇叫做 LIMA 的工作,在那篇工作里我们仅使用 1000 个样本就可以训练模型使其在达到接近 GPT4 的水平。但是这种 “少即是多” 的思想并没有在所有的任务场景上都得到了验证,比如数学推理。这也成为当时的遗憾,使得我对如何让大模型学好数学充满了兴趣。”上海交大生成式人工智能研究组负责人同时也是阿贝尔项目的负责人刘鹏飞分享道。“Abel 是为了致敬挪威伟大数学家 尼尔斯・阿贝尔 (Niels Henrik Abel) 在代数和分析方面的开创性工作而创建的,代数也是现在模型相对擅长解决的,不过,我们还有很长的路要走。”
模型表现
表 1:
版权及免责声明:凡本网所属版权作品,转载时须获得授权并注明来源“科技金融网”,违者本网将保留追究其相关法律责任的权力。凡转载文章,不代表本网观点和立场,如有侵权,请联系我们删除。