chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

自動駕駛中常提的卷積神經(jīng)網(wǎng)絡是個啥?

智駕最前沿 ? 來源:智駕最前沿 ? 作者:智駕最前沿 ? 2025-11-19 18:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

[首發(fā)于智駕最前沿微信公眾號]在自動駕駛領域,經(jīng)常會聽到卷積神經(jīng)網(wǎng)絡技術。卷積神經(jīng)網(wǎng)絡,簡稱為CNN,是一種專門用來處理網(wǎng)格狀數(shù)據(jù)(比如圖像)的深度學習模型。CNN在圖像處理中尤其常見,因為圖像本身就可以看作是由像素排列成的二維網(wǎng)格。

卷積神經(jīng)網(wǎng)絡可以概括為“從局部入手,逐步抽象”的一項技術,即通過一系列可學習的運算,讓網(wǎng)絡能夠自動從原始像素中識別出邊緣、角點、紋理等基礎特征,再逐步組合成更高級的語義信息,最終完成類似“識別出一只貓”這樣的感知任務。

wKgZPGkYGMSAP6LKAAB01FgQ2NM253.jpg

圖片源自:網(wǎng)絡

和傳統(tǒng)的全連接網(wǎng)絡相比,CNN不僅參數(shù)更少,還能更好地適應圖像中物體的平移變化,因此在計算效率和泛化能力上的表現(xiàn)會更加出色。

01核心組件和工作原理

想理解清楚CNN,要抓住“卷積核滑動”與“層層抽象”兩個要點。卷積操作就像拿著一個小窗口在圖像上逐格滑動,每次將窗口內的像素值與一組可訓練的權重(也就是卷積核或濾波器)做點乘并求和,得到輸出特征圖上的一個數(shù)值。

這樣訓練的目的,正是調整這些卷積核的參數(shù),讓它們能提取出有用的特征。由于卷積核遠小于整張圖像,并且在整個圖像上共享參數(shù),這種“局部連接”和“參數(shù)共享”的設計,大大減少了網(wǎng)絡的參數(shù)量。

卷積層后面通常會接一個如ReLU這樣的非線性激活函數(shù),它的作用是把負數(shù)值置零,從而引入非線性,讓網(wǎng)絡能夠表達更復雜的關系。之后就會進行如最大池化這樣的下采樣操作,它在局部區(qū)域中選取最大值輸出,這樣不僅能降低數(shù)據(jù)維度、壓縮信息,還能增強網(wǎng)絡對平移的魯棒性。

通過多個卷積層和池化層的堆疊,網(wǎng)絡會逐層把低級特征信息(如邊緣、紋理)組合成中級特征信息(如角點、局部形狀),再進一步抽象為高級特征信息(如物體部件或語義概念)。在網(wǎng)絡的末端,這些特征會被“展平”,再輸入到全連接層或經(jīng)過全局池化處理,最終通過分類器(如softmax)輸出每個類別的概率。

wKgZPGkYGMWAQlEzAAFALwHHgY8174.jpg

圖片源自:網(wǎng)絡

卷積并不局限于二維圖像。它可以擴展到一維數(shù)據(jù)(如語音、時間序列)和三維數(shù)據(jù)(如醫(yī)學影像中的體積數(shù)據(jù))。對于多通道輸入(例如彩色圖像的RGB三個通道),卷積核也會為每個通道配備一組權重,分別計算后再求和,生成單通道的特征圖。而為了提取不同類型的特征,可同時使用多個卷積核,以便得到多個特征圖(也稱為輸出通道)。

02訓練、優(yōu)化與常見技巧

訓練CNN的基本流程與其他神經(jīng)網(wǎng)絡類似,即先定義損失函數(shù)(分類任務常用交叉熵損失),再通過反向傳播計算梯度,最后使用優(yōu)化器(如隨機梯度下降SGD或Adam)更新網(wǎng)絡參數(shù)。在卷積層中,反向傳播本質上是對卷積運算求導,分別計算卷積核和輸入數(shù)據(jù)的梯度并更新。

在卷積神經(jīng)網(wǎng)絡的訓練過程中,學習率、批次大小和權重初始化等超參數(shù)的選擇至關重要,它們共同決定了訓練過程的穩(wěn)定性和模型的最終性能。為了抑制過擬合、提升模型的泛化能力,可綜合運用以下幾種實用技巧。

數(shù)據(jù)增強是非常有效的一種方法。通過對訓練圖像進行隨機翻轉、裁剪、旋轉或調整亮度對比度等操作,可以顯著增加數(shù)據(jù)的多樣性,這能迫使模型學習更加魯棒,而不是僅僅記住訓練集中的特定樣本。

權重衰減(L2正則化)和Dropout(隨機屏蔽部分神經(jīng)元)等正則化手段也是一種有效方式,不過在卷積層中使用Dropout通常會低于全連接層。批量歸一化如今已成為訓練深層網(wǎng)絡的標準配置,它通過對每批數(shù)據(jù)進行規(guī)范化處理,有效穩(wěn)定了訓練過程,加快了收斂速度,并允許我們使用更大的學習率。此外,在訓練過程中動態(tài)調整學習率的策略,以及根據(jù)驗證集表現(xiàn)適時停止訓練的“早停法”,也都是防止模型過擬合的常用手段。

除了上述訓練技巧,模型架構層面的改進也會對訓練結果產(chǎn)生深遠影響。殘差連接的引入是一項關鍵突破,它通過允許信息跨層直接傳遞,有效緩解了深層網(wǎng)絡中的梯度消失問題,使得訓練上百層的超深網(wǎng)絡成為可能。

wKgZPGkYGMaAYBZwAACbEiYvjeA479.jpg

圖片源自:網(wǎng)絡

深度可分離卷積則從計算效率入手,將標準的卷積操作拆解為逐通道卷積和逐點卷積兩個步驟,從而大幅降低了計算量和參數(shù)數(shù)量,這一設計對于在手機等移動設備上部署模型尤為關鍵。在實際的工程部署中,還會進一步運用模型壓縮、量化等技術,對訓練好的網(wǎng)絡進行優(yōu)化,以確保其在資源受限的環(huán)境中也能高效運行。

03重要架構演進與設計選擇

回顧卷積神經(jīng)網(wǎng)絡的發(fā)展歷程,可以清晰地了解其設計思想的演變。早期的LeNet成功地將卷積思想應用于手寫數(shù)字識別,證明了其有效性。隨后,AlexNet在大規(guī)模圖像分類競賽中取得突破性成果,極大地推動了深度學習的熱潮。VGG網(wǎng)絡則通過反復堆疊小巧的3x3卷積核,構建起結構規(guī)整而深厚的網(wǎng)絡,證明了深度的重要性。Inception系列則另辟蹊徑,采用并行結構來同時捕捉不同尺度的特征。ResNet引入的殘差連接,從根本上解決了深度網(wǎng)絡的訓練難題。近年來,為了在準確率和效率間取得平衡,出現(xiàn)了像MobileNet(使用深度可分離卷積)和EfficientNet(復合縮放模型深度、寬度和分辨率)這樣的輕量級架構。

卷積神經(jīng)網(wǎng)絡在計算機視覺領域的應用已經(jīng)非常廣泛,從基礎的圖像分類,到目標檢測、語義分割、人臉識別、姿態(tài)估計,乃至圖像生成和檢索,都能看到它的身影。

當然,CNN也有局限性,它在捕捉圖像中的長距離依賴及全局關系方面,天生不如基于自注意力機制的Transformer模型靈活。雖然可以通過加深網(wǎng)絡或使用大卷積核來擴大感受野,但這會帶來計算成本的急劇上升。此外,其引以為傲的平移不變性,在某些需要精確定位(如實例分割)的任務中,也需要額外的機制來輔助。

04最后的話

卷積神經(jīng)網(wǎng)絡通過“局部感知、參數(shù)共享、層次化抽象”這一核心思想,為處理圖像等網(wǎng)格數(shù)據(jù)提供了一個強大而高效的框架。卷積神經(jīng)網(wǎng)絡的優(yōu)勢,源于它與生俱來的合理結構。它采用“從小范圍入手”的策略,通過局部連接和權重共享,一層層地從圖像中提取特征,從簡單的邊緣、紋理,逐步組合成復雜的物體部件和整體概念。這種設計不僅極大地減少了需要計算的參數(shù)數(shù)量,更讓它天生就擅長處理圖像這類數(shù)據(jù)。這使CNN在擁有出色識別能力的同時,也保證了很高的計算效率,成為計算機視覺領域堅實的技術基石。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    卷積神經(jīng)網(wǎng)絡如何讓自動駕駛識別障礙物?

    自動駕駛的發(fā)展過程中,感知系統(tǒng)一直承擔車輛“眼睛”的角色,其核心任務是讓計算機理解復雜多變的物理世界。卷積神經(jīng)網(wǎng)絡(CNN)作為一種專門用于處理圖像和視頻等網(wǎng)格狀數(shù)據(jù)結構的深度學習模型,已經(jīng)成為
    的頭像 發(fā)表于 04-11 09:59 ?1401次閱讀
    <b class='flag-5'>卷積</b><b class='flag-5'>神經(jīng)網(wǎng)絡</b>如何讓<b class='flag-5'>自動駕駛</b>識別障礙物?

    自動駕駛中常的占用網(wǎng)絡檢測存在哪些問題?

    自動駕駛感知技術在過去幾年中經(jīng)歷了很大的變化,從最初的二維圖像檢測到鳥瞰圖投影,再到如今備受關注的占用網(wǎng)絡,感知技術的提升,讓自動駕駛的能力越來越強。
    的頭像 發(fā)表于 02-24 15:53 ?1151次閱讀

    自動駕駛中常的“深度估計”是

    [首發(fā)于智駕最前沿微信公眾號]當我們看一張照片時,可以通過肉眼自然地判斷照片中的物體遠近,這種對于空間和距離的感知,對于人類來說是本能,是從幼兒時期開始就形成的一種能力。 對于自動駕駛汽車來說
    的頭像 發(fā)表于 02-16 13:18 ?1.8w次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的“深度估計”是<b class='flag-5'>個</b><b class='flag-5'>啥</b>?

    Transformer如何讓自動駕駛變得更聰明?

    ]自動駕駛中常的Transformer本質上是一種神經(jīng)網(wǎng)絡結構,最早在自然語言處理里火起來。與卷積神經(jīng)
    的頭像 發(fā)表于 11-19 18:17 ?2440次閱讀

    NMSIS神經(jīng)網(wǎng)絡庫使用介紹

    (q7_t) 和 16 位整數(shù) (q15_t)。 卷積神經(jīng)網(wǎng)絡示例: 本示例中使用的 CNN 基于來自 Caffe 的 CIFAR-10 示例。神經(jīng)網(wǎng)絡由 3
    發(fā)表于 10-29 06:08

    自動駕駛中常的“強化學習”是

    [首發(fā)于智駕最前沿微信公眾號]在談及自動駕駛時,有些方案中會提到“強化學習(Reinforcement Learning,簡稱RL)”,強化學習是一類讓機器通過試錯來學會做決策的技術。簡單理解
    的頭像 發(fā)表于 10-23 09:00 ?868次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的“強化學習”是<b class='flag-5'>個</b><b class='flag-5'>啥</b>?

    自動駕駛中常的“專家數(shù)據(jù)”是?

    [首發(fā)于智駕最前沿微信公眾號]在談及自動駕駛時,經(jīng)常會聽到一概念,那便是“專家數(shù)據(jù)”。專家數(shù)據(jù),說白了就是“按理應該這么做”的那類示范數(shù)據(jù)。它不是隨機抓來的日志,也不是隨便標注的標簽,而是來源可靠
    的頭像 發(fā)表于 10-09 09:33 ?871次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的“專家數(shù)據(jù)”是<b class='flag-5'>個</b><b class='flag-5'>啥</b>?

    自動駕駛中常的ODD是

    [首發(fā)于智駕最前沿微信公眾號]在自動駕駛中,經(jīng)常會聽到一概念,那就是ODD。所謂ODD,全稱為Operational Design Domain,中文常譯為“運行設計域”或者“作業(yè)域”。直觀一點
    的頭像 發(fā)表于 09-22 09:04 ?1065次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的ODD是<b class='flag-5'>個</b><b class='flag-5'>啥</b>?

    自動駕駛中常的硬件在環(huán)是

    [首發(fā)于智駕最前沿微信公眾號]在談及自動駕駛技術時,經(jīng)常會提及一技術,那就是硬件在環(huán),所謂的硬件在環(huán)是?對于自動駕駛來說有
    的頭像 發(fā)表于 08-14 08:54 ?1444次閱讀

    自動駕駛中常的RTK是?

    [首發(fā)于智駕最前沿微信公眾號]在談及自動駕駛關鍵技術時,經(jīng)常會聽到一技術,那就是RTK,很多人看到RTK后一定會想,這到底是技術?為啥這個技術很少在發(fā)布會上看到,但對于
    的頭像 發(fā)表于 08-10 10:35 ?1451次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的RTK是<b class='flag-5'>個</b><b class='flag-5'>啥</b>?

    自動駕駛中常的慣性導航系統(tǒng)是?可以不用嗎?

    每次提到自動駕駛硬件時,大家可能第一反應想到的是激光雷達、車載攝像頭、毫米波雷達等,但想要讓自動駕駛車輛實際落地,有一硬件也非常重要,那就是慣性導航系統(tǒng)。在很多討論自動駕駛技術的內容
    的頭像 發(fā)表于 07-24 18:12 ?2154次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的慣性導航系統(tǒng)是<b class='flag-5'>個</b><b class='flag-5'>啥</b>?可以不用嗎?

    自動駕駛中常的高精度地圖是?有何審查要求?

    不僅在空間分辨率和數(shù)據(jù)豐富度上有質的飛躍,還在數(shù)據(jù)處理與安全管理方面提出了更嚴格的規(guī)范。那高精度地圖到底是?是否有什么具體需求? 高精度地圖,顧名思義,是一種面向自動駕駛的高分辨率、結構化道路環(huán)境數(shù)據(jù)集。它不僅包含道路的幾何
    的頭像 發(fā)表于 07-03 19:29 ?1207次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的高精度地圖是<b class='flag-5'>個</b><b class='flag-5'>啥</b>?有何審查要求?

    自動駕駛中常的世界模型是?

    對外部環(huán)境進行抽象和建模的技術,讓自動駕駛系統(tǒng)在一簡潔的內部“縮影”里,對真實世界進行描述與預測,從而為感知、決策和規(guī)劃等關鍵環(huán)節(jié)提供有力支持。 什么是世界模型? 我們不妨先把“世界模型”想象成一種“數(shù)字化的地
    的頭像 發(fā)表于 06-24 08:53 ?1369次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的世界模型是<b class='flag-5'>個</b><b class='flag-5'>啥</b>?

    自動駕駛中常的HMI是?

    [首發(fā)于智駕最前沿微信公眾號]在自動駕駛汽車領域,HMI(Human–Machine Interface,人機交互界面)正成為很多車企相互競爭的一大領域。之所以如此,是因為在車輛從“人控”過渡到“機
    的頭像 發(fā)表于 06-22 13:21 ?2457次閱讀

    自動駕駛中常的“點云”是

    ?對自動駕駛有何影響? 點云是? 點云(Point Cloud)是一種在三維空間中由大量離散點組成的數(shù)據(jù)集合,每個點包含自身的笛卡爾坐標(X、Y、Z),并可附帶顏色、強度、時間戳
    的頭像 發(fā)表于 05-21 09:04 ?1344次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的“點云”是<b class='flag-5'>個</b><b class='flag-5'>啥</b>?