太猛了猎鹰彻底开源400亿参数,

北京治手足癣好医院 https://m.39.net/disease/a_7467667.html
背景介绍

阿联酋的技术创新研究所(TII)开发的「Falcon」猎鹰是一款开源语言模型,目前该模型已经发布了三个版本——1B、7B和40B,其中 的版本,Falcon40B,拥有亿参数,是目前全球最强大的开源语言模型之一。值得一提的是,FalconLM在HuggingFaceOpenLLM排行榜上表现极为优异,在性能上甚至超过了LLaMA。

Falcon的性能和优势1、训练数据的选择

Falcon的竞争优势之一是训练数据的选择。研究团队开发了一个从公共爬网数据集中提取高质量数据并删除重复数据的流程。在彻底清理多余重复内容后,保留了5万亿的token——足以训练强大的语言模型。40B的FalconLM使用1万亿个token进行训练,7B版本的模型训练token达到1.5万亿。

2、更加可控的训练成本

TII称,与GPT-相比,Falcon在只使用75%的训练计算预算的情况下,就实现了显著的性能提升。而且在推断(Inference)时只需要只需要20%的计算时间。Falcon的训练成本,只相当于Chinchilla的40%和PaLM-62B的80%。成功实现了计算资源的高效利用。

、全球 免费商用开源模型

Falcon是目前 的可以免费商用的开源模型。土豪们表示,所有对Falcon的商业化使用和微调都不会收取任何费用。而且,TII还在全球征集商用化方案。对于有潜力的科研和商业化方案,他们还会提供更多的「训练算力支持」,或者提供进一步的商业化机会。

4、多语言能力

Falcon模型也具有多语言的能力。它理解英语、德语、西班牙语和法语,并且在荷兰语、意大利语、罗马尼亚语、葡萄牙语、捷克语、波兰语和瑞典语等一些欧洲小语种上也懂得不少。

对比分析与Meta的LLaMA相比,「Falcon」有许多优势:

1、更强大的性能:相对于拥有亿参数的LLaMA来说,Falcon40B拥有亿参数,性能能够与甚至超过LLaMA;

2、更加优秀的训练数据:Falcon在提取高质量数据并删除重复数据方面表现优秀;

、更低的训练成本:Falcon使用较少的训练成本,却能够实现更加卓越的表现;

4、开源程度更高:Falcon是目前 可以免费商用的开源模型;

5、多语言能力更加全面:Falcon不仅可以理解英语、德语、西班牙语和法语,还能够在一些欧洲小语种上表现优秀。

总结

「Falcon」作为一款全球有影响力的开源语言模型,已经受到了许多创业者和研究人员的

转载请注明:http://www.abuoumao.com/hyls/6383.html

网站简介| 发布优势| 服务条款| 隐私保护| 广告合作| 网站地图| 版权申明

当前时间: 冀ICP备19029570号-7