chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

在算力魔方上本地部署Phi-4模型

jf_23871869 ? 來源:jf_23871869 ? 作者:jf_23871869 ? 2025-01-15 11:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

?作者:算力魔方創(chuàng)始人/英特爾邊緣計(jì)算創(chuàng)新大使 劉力

前面我們分享了《Meta重磅發(fā)布Llama 3.3 70B:開源AI模型的新里程碑》,Llama 3.3 70B模型的發(fā)布,標(biāo)志著開源AI模型在智能水平上的一大飛躍。它不僅達(dá)到了之前只有Llama 3.1 405B模型才具備的智能水平,而且還超越了11月發(fā)布的GPT-4o模型。

wKgZPGeHLW-ABC3FAAFm4cCBsoA793.png

本文我們將分享微軟剛剛發(fā)布的Phi-4模型,其模型參數(shù)只有14B,是Llama3.3 70B的五分之一,但性能卻跟Llama 3.3 70B模型差不多,甚至在GPQA和MATH兩項(xiàng)上還超越了Llama3.3 70B!

參考鏈接:https://arxiv.org/pdf/2412.08905

本文將分享Phi-4 14B模型在算力魔方4060版上的部署過程。

一,算力魔方?簡(jiǎn)介

算力魔方?是一款可以DIY的迷你主機(jī),采用了抽屜式設(shè)計(jì),后續(xù)組裝、升級(jí)、維護(hù)只需要拔插模塊。通過選擇不同算力的計(jì)算模塊,再搭配不同的 IO 模塊可以組成豐富的配置,適應(yīng)不同場(chǎng)景。

性能不夠時(shí),可以升級(jí)計(jì)算模塊提升算力;IO 接口不匹配時(shí),可以更換 IO 模塊調(diào)整功能,而無需重構(gòu)整個(gè)系統(tǒng)。

本文以下所有步驟將在帶有英特爾i7-1265U處理器算力魔方?上完成驗(yàn)證。

二,安裝Ollama

請(qǐng)按照《Gemma 2+Ollama在算力魔方上幫你在LeetCode解題》安裝Ollama。

wKgZPGeHJcmAGKTfAAPzdFi2bXk106.png

三,運(yùn)行Phi-4

使用下面的命令完成運(yùn)行Phi-4:

ollama run phi4
wKgZPGeHJeuAN609AAGomLXNOs0320.png

四,測(cè)試Phi-4數(shù)學(xué)能力

輸入下面的數(shù)學(xué)問題,測(cè)試Phi-4的數(shù)學(xué)能力:

A farmer has a rectangular field with a length of 2x + 5 meters and a width of x - 3 meters.

Part A: Find the area of the field in terms of x.

Part B: If the area of the field is 150 square meters, determine the value of x.

Part C: Calculate the perimeter of the field.

五,總結(jié)

使用Ollama可以方便快捷的將Phi-4模型本地化部署在算力魔方?上。

如果你有更好的文章,歡迎投稿!

稿件接收郵箱:nami.liu@pasuntech.com

更多精彩內(nèi)容請(qǐng)關(guān)注“算力魔方?”!

?審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3810

    瀏覽量

    52253
  • 算力
    +關(guān)注

    關(guān)注

    2

    文章

    1658

    瀏覽量

    16832
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    想用RK3588邊緣端跑大模型?你的還差多少?

    邊緣計(jì)算與嵌入式AI應(yīng)用飛速發(fā)展的今天,瑞芯微RK3588平臺(tái)憑借其強(qiáng)大的多媒體處理能力和6TOPS的NPU,已成為高端AIoT項(xiàng)目的首選之一。然而,面對(duì)日益復(fù)雜的大模型(LLM
    的頭像 發(fā)表于 04-10 17:31 ?2184次閱讀
    想用RK3588<b class='flag-5'>在</b>邊緣端跑大<b class='flag-5'>模型</b>?你的<b class='flag-5'>算</b><b class='flag-5'>力</b>還差多少?

    本地部署OpenClaw,只要500元的開發(fā)板?

    電子發(fā)燒友網(wǎng)綜合報(bào)道 ?最近“小龍蝦”O(jiān)penClaw引爆了AI Agent本地部署的趨勢(shì),但同時(shí)暴露出來的安全問題,使得主力PC安裝需要用戶承擔(dān)較高的資產(chǎn)、數(shù)據(jù)安全風(fēng)險(xiǎn)。因此更低
    的頭像 發(fā)表于 03-20 14:56 ?2122次閱讀
    <b class='flag-5'>本地</b><b class='flag-5'>部署</b>OpenClaw,只要500元的開發(fā)板?

    【瑞薩AI挑戰(zhàn)賽】手寫數(shù)字識(shí)別模型RA8P1 Titan Board部署

    手寫數(shù)字識(shí)別模型RA8P1 Titan Board部署 手寫數(shù)字識(shí)別是計(jì)算機(jī)視覺領(lǐng)域的經(jīng)典入門任務(wù),而瑞薩RA8P1 Titan Board開發(fā)板憑借其搭載的雙內(nèi)核架構(gòu)與專用NP
    發(fā)表于 03-15 20:42

    技嘉與趨境科技聯(lián)合部署AMaaS平臺(tái) 推動(dòng)本地模型應(yīng)用加速落地

    在生成式AI加速走向?qū)嶋H應(yīng)用的當(dāng)下,大模型部署正從“可體驗(yàn)”邁向“可落地、可管理、可應(yīng)用”。作為技嘉面向本地AI場(chǎng)景打造的重要產(chǎn)品,AI TOP ATOM具備強(qiáng)大的桌面級(jí)本地AI
    的頭像 發(fā)表于 03-12 15:11 ?189次閱讀
    技嘉與趨境科技聯(lián)合<b class='flag-5'>部署</b>AMaaS平臺(tái) 推動(dòng)<b class='flag-5'>本地</b>大<b class='flag-5'>模型</b>應(yīng)用加速落地

    邊緣AI臨界點(diǎn):深度解析176TOPS香橙派AI Station的產(chǎn)業(yè)價(jià)值

    、內(nèi)存革命:48GB/96GB LPDDR4X 背后的帶寬博弈 很多開發(fā)者容易陷入唯論的誤區(qū),但在實(shí)際部署模型時(shí),內(nèi)存容量和帶寬往往是
    發(fā)表于 03-10 14:19

    魔方2025全年技術(shù)精華文章回顧:智驅(qū)萬物,方寸之間

    年末的鍵盤敲擊聲漸漸稀疏,屏幕滾動(dòng)的代碼終于安靜下來,回顧過去一年,魔方與萬千開發(fā)者一起,AI浪潮中見證了一個(gè)個(gè)技術(shù)奇跡從實(shí)驗(yàn)室走向
    的頭像 發(fā)表于 01-05 21:05 ?266次閱讀

    高達(dá) 1100 TOPS!內(nèi)置 Jetson AGX Orin 模組的高服務(wù)器

    CSB1-N4AGXOrin最高可配置4個(gè)NVIDIAJetsonAGXOrin(64GB)計(jì)算節(jié)點(diǎn),最高1100TOPS(INT8)。支持主流AI大
    的頭像 發(fā)表于 12-17 16:31 ?777次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>力</b>高達(dá) 1100 TOPS!內(nèi)置 Jetson AGX Orin 模組的高<b class='flag-5'>算</b><b class='flag-5'>力</b>服務(wù)器

    湘軍,讓變成生產(chǎn)?

    腦極體
    發(fā)布于 :2025年11月25日 22:56:58

    Immich智能相冊(cè)樹莓派5的高效部署與優(yōu)化

    將海外廣受歡迎的開源智能相冊(cè)項(xiàng)目Immich部署于樹莓派5,并通過搭載基于AX650N/AX8850的M.2卡,顯著提升了系統(tǒng)
    的頭像 發(fā)表于 10-14 11:30 ?1509次閱讀
    Immich智能相冊(cè)<b class='flag-5'>在</b>樹莓派5<b class='flag-5'>上</b>的高效<b class='flag-5'>部署</b>與優(yōu)化

    米爾RK3576部署端側(cè)多模態(tài)多輪對(duì)話,6TOPS驅(qū)動(dòng)30億參數(shù)LLM

    通過硬件優(yōu)化與軟件棧協(xié)同,將視覺編碼、語言推理、對(duì)話管理三大核心能力封裝為可落地的工程方案,而本文將聚焦其多輪對(duì)話的部署全流程,拆解從模型加載到交互推理的每一個(gè)關(guān)鍵環(huán)節(jié)。 RK
    發(fā)表于 09-05 17:25

    科技上線赤兔推理引擎服務(wù),創(chuàng)新解鎖FP8大模型

    模型輕量化部署方案。用戶通過遠(yuǎn)程平臺(tái)預(yù)置的模型鏡像與AI工具,僅需50%的GPU
    的頭像 發(fā)表于 07-30 21:44 ?1028次閱讀

    如何本地部署NVIDIA Cosmos Reason-1-7B模型

    下一步行動(dòng)。本文將一步步帶你本地服務(wù)器完成該模型部署,并搭建一個(gè)直觀的 Web 交互界面,親身體驗(yàn)前沿 AI 的“思考”過程。
    的頭像 發(fā)表于 07-09 10:17 ?998次閱讀

    基于魔方與PP-OCRv5的OpenVINO智能文檔識(shí)別方案

    )團(tuán)隊(duì)最新推出的PP-OCRv5模型精度和效率實(shí)現(xiàn)了顯著突破,結(jié)合Intel OpenVINO工具套件的硬件加速能力,能夠?yàn)楦黝愇臋n處理場(chǎng)景提供更強(qiáng)大的支持。 二,
    的頭像 發(fā)表于 06-12 21:19 ?1746次閱讀
    基于<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>魔方</b>與PP-OCRv5的OpenVINO智能文檔識(shí)別方案

    ElfBoard技術(shù)實(shí)戰(zhàn)|ELF 2開發(fā)板本地部署DeepSeek大模型的完整指南

    ELF 2開發(fā)板本地部署DeepSeek大模型的完整指南
    的頭像 發(fā)表于 05-16 11:13 ?2749次閱讀
    ElfBoard技術(shù)實(shí)戰(zhàn)|ELF 2開發(fā)板<b class='flag-5'>本地</b><b class='flag-5'>部署</b>DeepSeek大<b class='flag-5'>模型</b>的完整指南

    基于魔方的智能文檔信息提取方案

    的進(jìn)步,使得自動(dòng)化和智能化的文檔信息提取成為現(xiàn)實(shí)。本方案結(jié)合了Intel OpenVINO平臺(tái)的性能優(yōu)化優(yōu)勢(shì)與百度飛槳(PaddlePaddle)提供的PP-OCRv4模型,旨在開發(fā)一款高性能、高精度的智能文檔處理系統(tǒng)。
    的頭像 發(fā)表于 05-15 10:37 ?721次閱讀
    基于<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>魔方</b>的智能文檔信息提取方案