首页 > IT > AI Meta推出Llama 3大模型 在集成近25000块英伟达H100计算集群上训练

Meta推出Llama 3大模型 在集成近25000块英伟达H100计算集群上训练

【TechWeb】4月19日消息,据外媒报道,Meta公司在当地时间周四推出了他们最新一代大语言模型Llama 3的早期版本,并宣布推出基于这一模型打造的人工智能助手Meta AI。从外媒的报道来看,同前一代大模型Llama 2一样,Meta新一代的Llama 3大模型,也注重供用户免费使用,目前已有两种不同参数版本的Llama 3可供用户使用,分别为80亿参数和700亿参数,均已可在Meta官网…

【TechWeb】4月19日消息,据外媒报道,Meta公司在当地时间周四推出了他们最新一代大语言模型Llama 3的早期版本,并宣布推出基于这一模型打造的人工智能助手Meta AI。

从外媒的报道来看,同前一代大模型Llama 2一样,Meta新一代的Llama 3大模型,也注重供用户免费使用,目前已有两种不同参数版本的Llama 3可供用户使用,分别为80亿参数和700亿参数,均已可在Meta官网下载。

对于Llama 3大语言模型,Meta公司CEO马克•扎克伯格在接受采访时透露,他们在训练700亿参数的模型时,使用了15T tokens的数据,在训练过程中模型从未达到饱和状态,也就是从未在能力提升过程中遇到瓶颈,Meta最终也解决了训练过程中遇到的问题,并转向训练其他的模型。

正如外媒在报道中所提到的一样,Meta目前推出的还只是Llama 3的早期版本,他们还在训练更强大的模型。外媒在报道中就提到,Meta已宣布他们目前正在训练有4000亿参数的Llama 3模型,部分专家认为他们的这一模型,在MMLU、GPQA、HumanEval、MATH等方面的表现,将与OpenAI的GPT-4 Turbo, Anthropic的Claude 3 Opus和谷歌的Gemini Ultra相当。

作为全球人工智能领域重要参与者的英伟达,在Meta训练的Llama 3上也发挥了关键作用,提供了大量的GPU。

在Meta宣布推出Llama 3之后不久,英伟达就在官网上披露,Meta的工程师是在集成了24,576块H100 GPU的计算集群上训练的Llama 3,这些GPU通过英伟达的Quantum-2 InfiniBand网络连接。在英伟达的支持下,Meta也为他们的旗舰模型调整了网络、软件和模型架构。(海蓝)

本文来自网络,不代表头条在线-头条新闻网立场。
上一篇三年霸榜 亚马逊云科技为何成为中国AI开发平台顶流?
下一篇 返回列表
头条新闻网

来源: TechWeb.com.cn

本文来源于TechWeb.com.cn。包含文章,图片,视频等资源归属于原作者所有。如有侵权请联系gridf@126.com处理。紧急处理联系电话:15144810328

为您推荐

评论列表()

    联系我们

    联系我们

    0898-88888888

    在线咨询: QQ交谈

    邮箱: email@wangzhan.com

    工作时间:周一至周五,9:00-17:30,节假日休息

    关注微信
    微信扫一扫关注我们

    微信扫一扫关注我们

    关注微博
    返回顶部