chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

從M6到“通義千問(wèn)”,阿里大模型的迭代之路

智能計(jì)算芯世界 ? 來(lái)源:智能計(jì)算芯世界 ? 2023-04-19 09:51 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

阿里AI大模型“通義千問(wèn)”于 2023 阿里云峰會(huì)重磅發(fā)布?;A(chǔ)大模型的核心是能夠支撐各行各業(yè),阿里希望能夠?yàn)榭蛻襞c合作伙伴提供面向千行百業(yè)的專屬大模型。 從 M6 項(xiàng)目到“通義千問(wèn)”的發(fā)展之路。阿里 AI 大模型“通義千問(wèn)”前身系阿里達(dá)摩院 M6 項(xiàng)目,阿里達(dá)摩院于 2020 年 6 月發(fā)布 3 億參數(shù)基礎(chǔ)模型,21 年 1 月模型參數(shù)規(guī)模達(dá)百億,同年 5 月達(dá)萬(wàn)億參數(shù),同年 10月達(dá) 10 萬(wàn)億,成為全球首個(gè) 10 萬(wàn)億參數(shù)多模態(tài)大模型,并落地應(yīng)用于天貓?zhí)摂M主播等 40 多個(gè)細(xì)分場(chǎng)景。22年 9 月達(dá)摩院發(fā)布“通義”大模型系列,打造業(yè)界首個(gè) AI 底座,且兼顧大小模型的層次化建構(gòu)體系。

1 阿里大模型的迭代進(jìn)階之路

項(xiàng)目啟動(dòng)階段:M6 項(xiàng)目于 2020 年啟動(dòng),同年 6 月推出 3 億參數(shù)的基礎(chǔ)模型,2021年 1 月,模型參數(shù)規(guī)模達(dá)百億,成為世界最大的中文多模態(tài)模型。

萬(wàn)億模型階段:2021 年 5 月,達(dá)摩院發(fā)布萬(wàn)億參數(shù)模型 M6 并正式投入使用,追上谷歌發(fā)展腳步。M6 在多模態(tài) GreenAI、文到圖生成、商業(yè)化領(lǐng)域并肩世界一流水平,與英偉達(dá)、谷歌相比,M6 僅用 480 卡 V100 32G GPU 就實(shí)現(xiàn)了萬(wàn)億模型,節(jié)省算力資源超 80%,訓(xùn)練效率提升近 11 倍。

十萬(wàn)億模型階段:2021 年 10 月,M6 進(jìn)一步升級(jí)成為全球首個(gè) 10 萬(wàn)億參數(shù)的多模態(tài)大模型,并應(yīng)用于天貓?zhí)摂M主播等 40 多個(gè)創(chuàng)造相關(guān)場(chǎng)景中;在綠色低碳方面,相比 GPT-3,M6 實(shí)現(xiàn)了同等參數(shù)規(guī)模下,能耗僅為 1%。

大模型階段:2022 年 9 月,達(dá)摩院發(fā)布“通義”大模型系列,打造業(yè)界首個(gè) AI 統(tǒng)一底座,并構(gòu)建了大小模型協(xié)同的層次化人工智能體系,其中,統(tǒng)一底座 M6-OFA 模型在不引入新增結(jié)構(gòu)情況下,可同時(shí)處理 10 余項(xiàng)單模態(tài)和跨模態(tài)任務(wù),通義大模型的出現(xiàn)將為 AI 從感知智能邁向知識(shí)驅(qū)動(dòng)的認(rèn)知智能提供先進(jìn)基礎(chǔ)設(shè)施。

63879810-de35-11ed-bfe3-dac502259ad0.png

2 阿里達(dá)摩院年度科技趨勢(shì):阿里對(duì) AI 大模型高度重視 達(dá)摩院每年都會(huì)發(fā)布對(duì)當(dāng)年的十大科技趨勢(shì)預(yù)測(cè),在最近兩年的科技趨勢(shì)預(yù)測(cè)中,充分體現(xiàn)阿里對(duì) AI 技術(shù)及大模型的重視:

2022 年,達(dá)摩院在十大科技趨勢(shì)中提到多項(xiàng) AI 相關(guān)內(nèi)容,包括 AI for Science(將AI 應(yīng)用于高技術(shù)領(lǐng)域科學(xué)研究)、大小模型協(xié)同進(jìn)化、綠色能源 AI(基于 AI 算力對(duì)資源消耗嚴(yán)重的現(xiàn)實(shí),從降本增效角度提出了綠色能源 AI 新概念)等。

2023 年,達(dá)摩院在十大科技趨勢(shì)中,將多模態(tài)預(yù)訓(xùn)練大模型放在首位,足以顯現(xiàn)其對(duì)大模型的重視。CLIP 和 BEiT-3 等多模態(tài)模型實(shí)現(xiàn)技術(shù)突破,多模態(tài)融合的通用人工智能成為未來(lái)發(fā)展趨勢(shì)。多模態(tài)預(yù)訓(xùn)練的發(fā)展將重塑人工智能商業(yè)模式。多模態(tài)統(tǒng)一建模,目的增強(qiáng)模型的跨模態(tài)語(yǔ)義對(duì)齊能力,打通各模態(tài)之間的關(guān)系,促使模型逐步標(biāo)準(zhǔn)化?;诙囝I(lǐng)域知識(shí),構(gòu)建統(tǒng)一的、跨場(chǎng)景、多任務(wù)的多模態(tài)基礎(chǔ)模型將成為未來(lái)人工智能的重點(diǎn)發(fā)展方向。

63a27a40-de35-11ed-bfe3-dac502259ad0.png

通用模型層主要包含通義-M6、通義-AliceMind、通義-視覺(jué)三種通用模型。1)通義-M6 是國(guó)際首個(gè)參數(shù)規(guī)模達(dá)到 10 萬(wàn)億的全球最大預(yù)訓(xùn)練模型。2)通義-AliceMind作為開源深度語(yǔ)言模型體系,形成了從文本 PLUG 到多模態(tài) mPLUG 再到模塊化統(tǒng)一模型演化趨勢(shì)。3)通義-視覺(jué)可在電商行業(yè)實(shí)現(xiàn)圖像搜索和萬(wàn)物識(shí)別等場(chǎng)景應(yīng)用,并在文生圖以及交通和自動(dòng)駕駛領(lǐng)域發(fā)揮作用。

63c98cfc-de35-11ed-bfe3-dac502259ad0.png

3 統(tǒng)一技術(shù)底座-三位一體:M6-OFA 為通義大模型底座,實(shí)現(xiàn)架構(gòu)、模態(tài)、任務(wù)三方面統(tǒng)一 通義大模型在國(guó)內(nèi)率先構(gòu)建 AI 統(tǒng)一底座,在業(yè)界首次實(shí)現(xiàn)模態(tài)表示、任務(wù)表示、模型結(jié)構(gòu)的統(tǒng)一,統(tǒng)一學(xué)習(xí)范式 OFA 是通義大模型背后的核心技術(shù)支撐。 架構(gòu)統(tǒng)一:M6-OFA 采用了 Transformer Encoder-Decoder + ResNet Blocks 架構(gòu),ResNet Blocks 用于提取圖像特征,Transformer Encoder 負(fù)責(zé)多模態(tài)特征的交互,Transformer Decoder 采用自回歸方式輸出結(jié)果。無(wú)需增加任何任務(wù)特定的模型層,即可實(shí)現(xiàn)預(yù)訓(xùn)練與微調(diào)的相同學(xué)習(xí)模式。 模態(tài)統(tǒng)一:M6-OFA 構(gòu)建了一個(gè)涵蓋不同模態(tài)的通用詞表,以便模型使用該詞表表示不同任務(wù)的輸出結(jié)果。其中 BPE 編碼的自然語(yǔ)言 token 用于表示文本類任務(wù)或圖文類任務(wù)的數(shù)據(jù);圖片中連續(xù)的橫縱坐標(biāo)編碼為離散化 token,用于表示視覺(jué)定位、物體檢測(cè)的數(shù)據(jù);圖片中的像素點(diǎn)信息編碼為離散化 token,用于表示圖片生成、圖片補(bǔ)全等任務(wù)的數(shù)據(jù)。 任務(wù)統(tǒng)一:通過(guò)設(shè)計(jì)不同的 instruction,M6-OFA 將涉及多模態(tài)和單模態(tài)(即 NLP 和CV)的所有任務(wù)都統(tǒng)一建模成序列到序列(seq2seq)任務(wù)。M6-OFA 覆蓋了 5 項(xiàng)多模態(tài)任務(wù),視覺(jué)定位、定位字幕、圖文匹配、圖像字幕和視覺(jué)問(wèn)答;2 項(xiàng)視覺(jué)任務(wù),檢測(cè)和圖像填補(bǔ)和 1 項(xiàng)文本任務(wù),即文本填補(bǔ)。

63e085e2-de35-11ed-bfe3-dac502259ad0.png

4 通用模型層-通義視覺(jué)大模型 通義-視覺(jué)大模型自下往上分為了底層統(tǒng)一算法架構(gòu)、中層通用算法和上層產(chǎn)業(yè)應(yīng)用。在應(yīng)用層面,通義-視覺(jué)大模型可以在電商行業(yè)實(shí)現(xiàn)圖像搜索和萬(wàn)物識(shí)別等場(chǎng)景應(yīng)用,并在文生圖以及交通和自動(dòng)駕駛領(lǐng)域發(fā)揮作用。

640be4f8-de35-11ed-bfe3-dac502259ad0.png

阿里大模型賦能天貓精靈有望承擔(dān)智能家居生態(tài)入口角色。結(jié)合真格基金 7 項(xiàng)針對(duì)大模型的測(cè)試題與答復(fù),阿里大模型天貓精靈壓縮版的成績(jī)?yōu)?4.5/2.5,表現(xiàn)優(yōu)于文心一言(1/6)和 GPT3.5(4/3),遜于 GPT4.0(7/0)。可見(jiàn)在簡(jiǎn)單的邏輯推理和垂直能力領(lǐng)域,阿里大模型壓縮版已初步具備與 ChatGPT 與文心一言一較高下的實(shí)力。

6427ba52-de35-11ed-bfe3-dac502259ad0.png

644757d6-de35-11ed-bfe3-dac502259ad0.png

通義千問(wèn)賦能天貓精靈有望成為智能居家生態(tài)入口的不二選擇。阿里大模型通義千問(wèn)有望賦能旗下智能音箱天貓精靈打造居家場(chǎng)景智能生態(tài)入口,與螢石網(wǎng)絡(luò)等智能家居廠商優(yōu)勢(shì)互補(bǔ),通過(guò)“人機(jī)自然交互、信息上傳云端,聯(lián)動(dòng)控制反饋”的機(jī)制,開展智能家居生態(tài)共建。

645de73a-de35-11ed-bfe3-dac502259ad0.png

647c9df6-de35-11ed-bfe3-dac502259ad0.png

阿里大模型“通義千問(wèn)”有望基于其升級(jí)版天貓精靈(智能居家入口)、淘寶(智能電商入口)、釘釘(智能辦公入口)、高德地圖(智能汽車入口)等,協(xié)同合作廠商共建阿里系生態(tài),借助多項(xiàng)生態(tài)入口打造覆蓋“衣食住行工”的全域智能生態(tài)場(chǎng)景。目前,發(fā)布會(huì)已披露三大場(chǎng)景:智能居家:通義千問(wèn)×智能家居(天貓精靈等),有望成為具備個(gè)性化故事生成、個(gè)性化歌單推薦、個(gè)性化菜譜生成等功能的智能生活助理。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39490

    瀏覽量

    301002
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3730

    瀏覽量

    52055
  • 阿里達(dá)摩院
    +關(guān)注

    關(guān)注

    0

    文章

    32

    瀏覽量

    3613

原文標(biāo)題:從M6到“通義千問(wèn)”,阿里大模型的迭代之路

文章出處:【微信號(hào):AI_Architect,微信公眾號(hào):智能計(jì)算芯世界】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    阿里巴巴發(fā)布通義問(wèn)旗艦推理模型Qwen3-Max-Thinking

    今天,我們正式發(fā)布問(wèn)旗艦推理模型Qwen3-Max-Thinking,創(chuàng)下數(shù)項(xiàng)權(quán)威評(píng)測(cè)全球新紀(jì)錄。
    的頭像 發(fā)表于 01-27 15:47 ?315次閱讀
    <b class='flag-5'>阿里</b>巴巴發(fā)布<b class='flag-5'>通義</b><b class='flag-5'>千</b><b class='flag-5'>問(wèn)</b>旗艦推理<b class='flag-5'>模型</b>Qwen3-Max-Thinking

    比Google更快!阿里問(wèn)率先推出AI購(gòu)物、點(diǎn)外賣,全面打通阿里生態(tài)

    1月15日,在阿里問(wèn)產(chǎn)品迭代發(fā)布會(huì)上,阿里巴巴集團(tuán)副總裁、阿里
    的頭像 發(fā)表于 01-15 14:39 ?7195次閱讀
    比Google更快!<b class='flag-5'>阿里</b><b class='flag-5'>千</b><b class='flag-5'>問(wèn)</b>率先推出AI購(gòu)物、點(diǎn)外賣,全面打通<b class='flag-5'>阿里</b>生態(tài)

    Powered by XuanTie,Qwen Inside:阿里通義模型攜手玄鐵 RISC-V開啟“端側(cè)智能”新紀(jì)元

    在 AI 邁向“端邊云協(xié)同”的新時(shí)代,大模型的價(jià)值不僅在于云端的超強(qiáng)算力,更在于能否高效、低成本地部署行百業(yè)的終端設(shè)備中。近日,阿里通義
    的頭像 發(fā)表于 01-12 11:49 ?190次閱讀
    Powered by XuanTie,Qwen Inside:<b class='flag-5'>阿里</b><b class='flag-5'>通義</b>大<b class='flag-5'>模型</b>攜手玄鐵 RISC-V開啟“端側(cè)智能”新紀(jì)元

    問(wèn)APP與通義系列大模型,才是智能汽車的“黃金組合”

    座艙的正確打開方式;單點(diǎn)智能撬動(dòng)的價(jià)值有限,完整的場(chǎng)景化體驗(yàn)是用戶的最終選擇。 在這種市場(chǎng)趨勢(shì)下,阿里巴巴問(wèn)APP與通義系列大模型,具備成
    的頭像 發(fā)表于 12-30 17:25 ?611次閱讀

    阿里通義問(wèn)發(fā)布小尺寸模型Qwen3-4B,手機(jī)也能跑

    電子發(fā)燒友網(wǎng)綜合報(bào)道 8月7日,阿里通義問(wèn)宣布發(fā)布更小尺寸新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thi
    的頭像 發(fā)表于 08-12 17:15 ?6671次閱讀
    <b class='flag-5'>阿里</b><b class='flag-5'>通義</b><b class='flag-5'>千</b><b class='flag-5'>問(wèn)</b>發(fā)布小尺寸<b class='flag-5'>模型</b>Qwen3-4B,手機(jī)也能跑

    AI大模型加速上車,聯(lián)手高通,阿里有哪些策略?

    系列模型衍生數(shù)量超Llama,三大方向形成 阿里巴巴的“AI大模型通義問(wèn)
    的頭像 發(fā)表于 07-03 01:10 ?9058次閱讀
    AI大<b class='flag-5'>模型</b>加速上車,聯(lián)手高通,<b class='flag-5'>阿里</b>有哪些策略?

    廣和通加速通義問(wèn)Qwen3在端側(cè)全面落地

    6月,廣和通宣布:率先完成通義問(wèn)Qwen3系列混合推理模型在高通QCS8550平臺(tái)端側(cè)的適配部署。廣和通通過(guò)定制化混合精度量化方案與創(chuàng)新硬
    的頭像 發(fā)表于 06-25 15:35 ?1080次閱讀

    比亞迪座艙接入通義模型,未來(lái)將聯(lián)合打造更多AI智能座艙場(chǎng)景

    高質(zhì)量壁紙,隨時(shí)間自動(dòng)調(diào)節(jié)光影與色調(diào),打造行業(yè)首創(chuàng)的個(gè)性化車載體驗(yàn);基于通義星塵,上線“心理伴聊”等場(chǎng)景,結(jié)合智能語(yǔ)音對(duì)話系統(tǒng),為車主提供情感陪伴、心理療愈,打造“溫暖”座艙;在營(yíng)銷服務(wù)領(lǐng)域,比亞迪基于阿里云百煉調(diào)用通義
    的頭像 發(fā)表于 06-12 08:52 ?628次閱讀

    Arm CPU適配通義問(wèn)Qwen3系列模型

    近日,阿里巴巴開源了新一代通義問(wèn)模型 Qwen3,Arm 率先成為首批成功適配該模型的計(jì)算平臺(tái)
    的頭像 發(fā)表于 05-12 16:37 ?1405次閱讀

    壁仞科技完成阿里巴巴通義問(wèn)Qwen3全系列模型支持

    4月29日,阿里巴巴通義問(wèn)發(fā)布并開源8款新版Qwen3系列“混合推理模型”(簡(jiǎn)稱“Qwen3”)。Qwen3發(fā)布后數(shù)小時(shí)內(nèi),壁仞科技完成全
    的頭像 發(fā)表于 04-30 15:19 ?1556次閱讀

    低至¥2.27/h!就能使用全球最強(qiáng)開元模型——問(wèn) QwQ-32B

    ABSTRACT摘要捷智算平臺(tái)上新全球最強(qiáng)開元模型——問(wèn)QwQ-32B。JAEALOT2025年3月18日3月17日,阿里通義
    的頭像 發(fā)表于 03-19 12:34 ?1080次閱讀
    低至¥2.27/h!就能使用全球最強(qiáng)開元<b class='flag-5'>模型</b>——<b class='flag-5'>千</b><b class='flag-5'>問(wèn)</b> QwQ-32B

    阿里最新消息:國(guó)家超算互聯(lián)網(wǎng)平臺(tái)、廣州算力中心、多所高校接入通義問(wèn)模型

    ? 國(guó)家超算互聯(lián)網(wǎng)平臺(tái) 接入阿里通義問(wèn)模型 ? 3月10日,國(guó)家超算互聯(lián)網(wǎng)平臺(tái)接入阿里巴巴
    的頭像 發(fā)表于 03-14 11:54 ?1384次閱讀

    Manus與阿里通義達(dá)成合作

    據(jù)媒體報(bào)道,火爆異常的AI Agent新秀Manus和阿里云旗下大語(yǔ)言模型通義問(wèn)達(dá)成合作。雙方將基于
    的頭像 發(fā)表于 03-12 15:47 ?1455次閱讀

    摩爾線程支持阿里通義問(wèn)QwQ-32B開源模型

    近日,阿里云團(tuán)隊(duì)正式開源全新推理模型——通義問(wèn)QwQ-32B。摩爾線程在該模型發(fā)布后2小時(shí)內(nèi),
    的頭像 發(fā)表于 03-07 17:48 ?1336次閱讀
    摩爾線程支持<b class='flag-5'>阿里</b>云<b class='flag-5'>通義</b><b class='flag-5'>千</b><b class='flag-5'>問(wèn)</b>QwQ-32B開源<b class='flag-5'>模型</b>

    廣和通基于阿里通義模型推出隨身智能解決方案,賦能消費(fèi)電子終端行業(yè)

    2月,廣和通與全球領(lǐng)先的云解決方案提供商阿里云達(dá)成合作:廣和通AI模組及解決方案,基于阿里通義問(wèn)
    的頭像 發(fā)表于 03-03 17:55 ?1369次閱讀
    廣和通基于<b class='flag-5'>阿里</b>云<b class='flag-5'>通義</b>大<b class='flag-5'>模型</b>推出隨身智能解決方案,賦能消費(fèi)電子終端行業(yè)