您的位置：首页 >原创 >

“西湖”西湖大学成立5周年，施一公：做创新的守护者是使命也是未来 “考生”下半年自考即将开始省考试院发出温馨提示 “铜陵”化工厂爆炸？两名造谣者被查处 “尔森”用心倾听大自然的神秘邀约 “小行星”我国2030年前后实现载人登月 “在我”忆来只把旧书读 “儿子”妈妈将50余万“读书钱”存儿子名下，19岁儿子取出转给女友，妈妈无奈起诉追回 “父亲”父亲的眼神杀 “爷爷”爷爷的石榴树 “考生”硕士统考发布报名提醒考生需及时自查，抓紧时间修改 “都是”A股的觉醒之年！ “科博会”芜湖科博会集中展示大国重器 “力学”王博已任大连理工大学副校长 “这是”自内耗到自洽 “陈老”高山仰止，景行行止 ——读春桃老师所著《国医》 “合肥市”“柿柿如意，柿如破竹”…… 高三学子“花式解压” “孩子”一生的功课 “诗人”带着大海散步的人 “说了”云朵的话语，心灵的方剂 ——读周实《有些话语好像云朵》 “大桥”G3铜陵长江公铁大桥先导索过江 “超新星”云南天文台发现Ia型超新星前身星候选体 “某甲”父亲被羁押继母要离婚，未成年女儿谁来抚养？法官多方努力，难题解决了！ “知网”中国知网用户委员会两名成员公开亮相 “肌肉”磁铁刺激疗法可“对齐”肌肉纤维 “益康”倍益康上市几个月收入净利都大减市值仅几亿创始人张文有啥办法？ “宁德”宁德时代三季报：业绩增速放缓、海外市场份额扩大 “科幻”和成都和教育，一起遇见未来！两份重要“科幻教育”名单公布 “亚马逊”哪些以色列芯片公司已被美国企业收购？ “宜宾”近2万人参加！2023宜宾长江马拉松开跑：埃塞俄比亚选手包揽全马组男女前三名 “低价”第15个双11：电商巨头争夺“最低价”、取消预售、开放生态 “科幻”嘉宾共话科幻的未来：被视为“珍贵市场”，中国科幻正青春 “新材料”信金控股完成新一期人民币基金首关 “红星”梁静茹南京演唱会再现“柱子票” 主办方：临时布置追光灯，正与观众沟通 “结构”结核杆菌致病机制获揭示 “鲁南”鲁南制药集团建厂55周年：“向新向未来” “犯罪嫌疑人”湖南新化砍伤一对夫妇的犯罪嫌疑人落网，4人涉嫌窝藏罪被批捕 “灯会”红星观察｜自贡灯会走出“春节舒适区”：首次试水中秋国庆主题灯会火出圈背后 “同比增长”失守3000点后，A股市场的危与机｜智氪 “导盲犬”视障女子自曝带导盲犬进公园遭保安阻拦公园方：天色较晚不知其实情，沟通后已放行 “装修”装修公司老板明知公司亏损仍吸引客户签合同，骗取上百人700余万，被判11年 “小行星”首次！我国计划实施近地小行星防御任务 “射电”穿越80亿光年的快速射电暴源于一场“星系交通事故” “民谣”玉林民谣，从成都走向深圳 “中国移动”中移动市场详情：合作伙伴大会重要发言及发布、反诈、5G应用获奖 “华为”新麒麟全面替代！曝华为正在清理骁龙机型库存：掀起全线新品的“洪流” “商务部”商务部：达成共识！ “肿瘤”科学家揭示肿瘤免疫逃逸新机制，鉴定三个癌症生存相关因子，为肿瘤免疫治疗注入新动力 “必胜客”必胜客最黑暗的料理来了 “亿元”爱仕达董事长陈合林做铁锅起家公司已连续亏损两年多他有啥招术？ “血液”简单的血液检查调整可使重症监护治疗更安全

“模型”两大可商用开源大模型同时发布，性能不输 LLaMA，羊驼家族名字都不够用了

2023-05-08 13:05:48来源：IT之家

今天，很高兴为大家分享来自IT之家的两大可商用开源大模型同时发布，性能不输 LLaMA，羊驼家族名字都不够用了，如果您对两大可商用开源大模型同时发布，性能不输 LLaMA，羊驼家族名字都不够用了感兴趣，请往下看。

从 Meta 的 LLaMA 发展出的羊驼家族一系列大模型，已成为开源 AI 重要力量。

但 LLamA 开源了又没全开，只能用于研究用途，还得填申请表格等，也一直被业界诟病。

好消息是，两大对标 LLaMA 的完全开源项目同时有了新进展。

可商用开源大模型来了，还一下来了俩：

MosaicML 推出 MPT 系列模型，其中 70 亿参数版在性能测试中与 LLaMA 打个平手。

Together 的 RedPajama（红睡衣）系列模型，30 亿参数版在 RTX2070 游戏显卡上就能跑。

对于这些进展，特斯拉前 AI 主管 Andrej Karpathy 认为，开源大模型生态有了寒武纪大爆发的早期迹象。

MPT 系列模型，全称 MosaicML Pretrained Transformer，基础版本为 70 亿参数。

MPT 在大量数据（1T tokens）上训练，与 LLaMA 相当，高于 StableLM，Pythia 等其他开源模型。

支持 84k tokens 超长输入，并用 FlashAttention 和 FasterTransformer 方法针对训练和推理速度做过优化。

在各类性能评估中，与原版 LLaMA 不相上下。

除了 MPT-7B Base 基础模型外还有三个变体。

MPT-7B-Instruct，用于遵循简短指令。

MPT-7B-Chat，用于多轮聊天对话。

MPT-7B-StoryWriter-65k+，用于阅读和编写故事，支持 65k tokens 的超长上下文，用小说数据集微调。

MosaicML 由前英特尔 AI 芯片项目 Nervana 负责人 Naveen Rao 创办。

该公司致力于降低训练神经网络的成本，推出的文本和图像生成推理服务成本只有 OpenAI 的 1/15。

RedPajama 系列模型，在 5TB 的同名开源数据上训练而来（前面提到的 MPT 也是用此数据集训练）。

除 70 亿参数基础模型外，还有一个 30 亿参数版本，可以在 5 年前发售的 RTX2070 游戏显卡上运行。

目前 70 亿版本完成了 80% 的训练，效果已经超过了同规模的 Pythia 等开源模型，略逊于 LLamA。

预计在完成 1T tokens 的训练后还能继续改进。

背后公司 Together，由苹果前高管 Vipul Ved Prakash，斯坦福大模型研究中心主任 Percy Liang，苏黎世联邦理工大学助理教授张策等人联合创办。

开源模型发布后，他们的近期目标是继续扩展开源 RedPajama 数据集到两倍规模。

来自南美洲的无峰驼类动物一共 4 种，已被各家大模型用完了。

Meta 发布 LLaMA 之后，斯坦福用了 Alpaca，伯克利等单位用了 Alpaca，Joseph Cheung 等开发者团队用了 Guanaco。

以至于后来者已经卷到了其他相近动物，比如 IBM 的单峰骆驼 Dromedary，Databricks 的 Dolly 来自克隆羊多莉。

国人研究团队也热衷于用古代传说中的神兽，如 UCSD 联合中山大学等推出的白泽。

港中文等推出的凤凰……

最绝的是哈工大基于中文医学知识的 LLaMA 微调模型，命名为华驼。

参考链接：

本文来自微信公众号：量子位（ID：QbitAI），作者：梦晨

好了，关于两大可商用开源大模型同时发布，性能不输 LLaMA，羊驼家族名字都不够用了就讲到这。

返回科技金融网首页 >>

版权及免责声明：凡本网所属版权作品，转载时须获得授权并注明来源“科技金融网”，违者本网将保留追究其相关法律责任的权力。凡转载文章，不代表本网观点和立场，如有侵权，请联系我们删除。

相关文章

精彩推荐

“大桥”G3铜陵长江公铁大桥先导索过江

“某甲”父亲被羁押继母要离婚，未成年女儿谁来抚养？法官多方努

“亚马逊”哪些以色列芯片公司已被美国企业收购？

“装修”装修公司老板明知公司亏损仍吸引客户签合同，骗取上百人

“必胜客”必胜客最黑暗的料理来了

“运营商”运营商本周行业动态：电信年度优秀领导及上半年重点工

最新文章

“在我”忆来只把旧书读

“科博会”芜湖科博会集中展示大国重器

“诗人”带着大海散步的人

“宁德”宁德时代三季报：业绩增速放缓、海

“新材料”信金控股完成新一期人民币基金首

“同比增长”失守3000点后，A股市场的危与

“商务部”商务部：达成共识！

“基金”又一家基金公司换董事长，年内公募

图文欣赏

“儿子”妈妈将50余万“读书钱”存儿子名下，19岁儿子取出转给女友，妈妈无奈起诉追回

“儿子”妈妈将50余万“读书钱”存儿子名

“说了”云朵的话语，心灵的方剂 ——读周实《有些话语好像云朵》

“说了”云朵的话语，心灵的方剂 ——

“科幻”和成都和教育，一起遇见未来！两份重要“科幻教育”名单公布

“科幻”和成都和教育，一起遇见未来！两

“红星”梁静茹南京演唱会再现“柱子票” 主办方：临时布置追光灯，正与观众沟通

“红星”梁静茹南京演唱会再现“柱子票”

热门文章

Techuk敦促政府回到新兴数字清洁技术部门

“霸王”新品被群嘲，霸王茶姬的争议棋局

“版本”开源办公套件 OpenOffice 4.1.14

“之门”《博德之门 3》大获成功后，拉瑞

剑桥学生提供了赢得10,000英镑的机会，在三

谷歌可以在欧盟反托拉斯探针中面临3.4亿美元

“南京市”南京税务普法教育进社区共迎第

Microsoft可能会修复Windows SMB SMB拒绝