Meta推出最強(qiáng)開源模型Llama 3 要挑戰(zhàn)GPT
Facebook母公司Meta Platforms(META.US)推出了開源AI大模型“Llama”的最新升級(jí)版本“Llama 3”,Meta公司這次開源了Llama 3 8B與70B兩款不同規(guī)模的模型,開發(fā)者可以免費(fèi)使用,而Meta公司還將陸續(xù)推出一系列具備多模態(tài)、多語(yǔ)言對(duì)話、更長(zhǎng)上下文窗口等能力的新模型。
據(jù)悉Meta用搭載超2.4萬(wàn)塊H100芯片的計(jì)算機(jī)集群訓(xùn)練Llama 3。Llama 3最大參數(shù)規(guī)模超4000億,訓(xùn)練token超15萬(wàn)億,訓(xùn)練數(shù)據(jù)規(guī)模差不多是Llama 2的七倍。而且訓(xùn)練效率比Llama 2高3倍;同時(shí)在安全性也有非常明顯的進(jìn)步。對(duì)比GPT-3.5多種人類評(píng)估測(cè)評(píng)勝率超六成。
基于Llama 3模型目前已經(jīng)覆蓋Instagram、WhatsApp、Facebook等Meta公司的應(yīng)用軟件。
OpenAI的核心創(chuàng)始成員之一、特斯拉前AI總監(jiān)Andrej Karpathy認(rèn)為400B Llama3性能已接近GPT-4 的水平。
Meta首席產(chǎn)品官考克斯表示Llama 3在它參數(shù)模型的許多基準(zhǔn)上都處于行業(yè)領(lǐng)先地位。
有業(yè)界分析師認(rèn)為開源大模型Llama 3期待已久,Meta公司肯定非常希望Llama3能夠超越OpenAI的GPT-4。
-
Meta
+關(guān)注
關(guān)注
0文章
325瀏覽量
12496 -
ChatGPT
+關(guān)注
關(guān)注
31文章
1599瀏覽量
10390 -
大模型
+關(guān)注
關(guān)注
2文章
3750瀏覽量
5268
發(fā)布評(píng)論請(qǐng)先 登錄
商湯科技正式開源多模態(tài)自主推理模型SenseNova-MARS
百度正式發(fā)布并開源新一代文檔解析模型PaddleOCR-VL-1.5
上海交大發(fā)布國(guó)產(chǎn)光學(xué)大模型Optics GPT
谷歌正式推出Gemini 3 Flash模型
【CIE全國(guó)RISC-V創(chuàng)新應(yīng)用大賽】基于 K1 AI CPU 的大模型部署落地
新思科技SLM解決方案守護(hù)AI芯片萬(wàn)億算力
GPT-5.1發(fā)布 OpenAI開始拼情商
成都匯陽(yáng)投資關(guān)于大模型白熱化,應(yīng)用加速分化
大規(guī)模專家并行模型在TensorRT-LLM的設(shè)計(jì)
Meta推出最強(qiáng)開源模型Llama 3 要挑戰(zhàn)GPT
評(píng)論