昨天,百度研究院宣布他們開發(fā)了一種深度學(xué)習(xí)算法,在檢測(cè)乳腺癌的微轉(zhuǎn)移方面超過了人類病理學(xué)醫(yī)生的表現(xiàn)。以下是論智對(duì)該項(xiàng)目的編譯報(bào)道。
癌癥是目前醫(yī)學(xué)領(lǐng)域的重大挑戰(zhàn)之一,應(yīng)對(duì)癌癥最有效的方法之一就是早發(fā)現(xiàn)、早治療,這對(duì)提高病人的生存率有著重要意義。早期檢測(cè)的主要方法就是檢查淋巴結(jié)是否有癌細(xì)胞的微轉(zhuǎn)移。目前,對(duì)活組織檢查的病理研究通常被視作金標(biāo)準(zhǔn)。然而,檢查病理片子也并不容易,很多時(shí)候需要經(jīng)驗(yàn)豐富的病理醫(yī)生進(jìn)行診斷。放大40倍的數(shù)字化病理圖片通常含有數(shù)十億個(gè)像素,可能會(huì)占用好幾個(gè)G的磁盤空間。在這些大型文件里,病理醫(yī)生們有時(shí)還需要找到癌癥的微轉(zhuǎn)移,或者象征癌癥早期的小范圍腫瘤細(xì)胞。這些腫瘤細(xì)胞群的直徑可能還不到1000個(gè)像素。所以想在醫(yī)學(xué)影像中不放過任何細(xì)微并且有價(jià)值的標(biāo)記,是非常復(fù)雜且耗時(shí)的工作。如下圖,就展示了這一過程的難度。
注:在放大40倍的數(shù)字化病理圖像中,一個(gè)像素約為0.243微米。而微轉(zhuǎn)移的判斷標(biāo)準(zhǔn)通常為最大直徑為200微米以上的腫瘤細(xì)胞群,大約相當(dāng)于823個(gè)像素。
目前為止,有許多科學(xué)家提出用基于深度學(xué)習(xí)的算法幫助病理醫(yī)生進(jìn)行醫(yī)學(xué)影像分析,檢測(cè)癌癥是否轉(zhuǎn)移。由于原始電子影像體積非常大,大多數(shù)算法目前只是將影像分割成更小的圖像塊,例如256×256像素的小圖。之后,人們會(huì)訓(xùn)練一個(gè)深度卷積神經(jīng)網(wǎng)絡(luò),將包含腫瘤細(xì)胞的圖像和正常組織圖像區(qū)分開來。但是,有些時(shí)候如果不參考周圍的組織,就很難判斷某張圖片中是否含有腫瘤細(xì)胞,誤報(bào)也會(huì)經(jīng)常出現(xiàn)。下圖就是這樣難以判斷的例子:
最近,百度研究院的科學(xué)家們提出了一種新的深度學(xué)習(xí)算法,在輸入時(shí)不只輸入單一的圖像,而是將其分割成網(wǎng)格狀,連同周圍的圖像一同作為輸入,用神經(jīng)條件隨機(jī)場(chǎng)(NCRF)對(duì)周圍圖像的空間關(guān)系進(jìn)行建模,預(yù)測(cè)它們是腫瘤細(xì)胞還是正常細(xì)胞。這種技術(shù)可以看做是病理醫(yī)生將醫(yī)學(xué)影像縮小,視野進(jìn)一步擴(kuò)大,從而能做出更可靠的判斷。相鄰幾張圖片之間的空間關(guān)系通過一種特殊的概率圖形模型進(jìn)行建模,該模型成為“條件隨機(jī)場(chǎng)(conditional random fields)”。而整個(gè)深度學(xué)習(xí)框架可以在端到端GPU上進(jìn)行訓(xùn)練,并且不需要任何后期處理。
算法的基本架構(gòu)如下圖所示:

NCRF有兩個(gè)主要部分組成:CNN和CRF。CNN主要作為特征提取器,將網(wǎng)格一樣的圖像輸入CNN中后,它會(huì)將每個(gè)圖像塊編碼成固定長(zhǎng)度的向量表示(即嵌入)。這些嵌入之后被輸入到CRF中,并對(duì)它們的空間關(guān)系進(jìn)行建模。CRF最后輸出的是每個(gè)圖像塊的邊緣分布(marginal distribution),用來表示這是正常組織還是腫瘤細(xì)胞的圖像。
在實(shí)驗(yàn)過程中,百度所提出的NCRF方法與其他沒有CRF的傳統(tǒng)算法有三點(diǎn)不同:
NCRF有著更光滑的概率圖,其中邊界更清晰
NCRF的分類準(zhǔn)確度更高
NCRF在檢測(cè)癌癥轉(zhuǎn)移時(shí),比普通方法表現(xiàn)得更好
通過分析相鄰圖像間的空間關(guān)系,研究人員所提的算法產(chǎn)生的誤報(bào)率更少。下圖展示了該算法所預(yù)測(cè)出的腫瘤區(qū)域,以及和之前不考慮相鄰區(qū)域的算法之間的對(duì)比??梢钥吹交贜CRF的算法有更少的誤報(bào)情況:

(a)原始影像圖片;(b)經(jīng)過病理醫(yī)生標(biāo)注過的圖像,白色區(qū)域表示腫瘤細(xì)胞轉(zhuǎn)移;(c)傳統(tǒng)算法預(yù)測(cè)的腫瘤區(qū)域;(d)我們的算法預(yù)測(cè)的腫瘤區(qū)域
第二,NCRF通過在訓(xùn)練時(shí)結(jié)合周圍圖像之間的空間關(guān)系,提高了CNN特征提取器的準(zhǔn)確度。下圖顯示了在ResNet-18架構(gòu)上,傳統(tǒng)方法和NCRF方法的不同。

可以看到,NCRF在訓(xùn)練時(shí)的精確度比傳統(tǒng)方法要高。
另外,在評(píng)估NCRF檢測(cè)腫瘤轉(zhuǎn)移性能的實(shí)驗(yàn)上,研究人員得到了以下結(jié)果:

最后,在Camelyon16挑戰(zhàn)賽的測(cè)試集上,該算法在腫瘤定位分?jǐn)?shù)(FROC)上取得了0.8096的成績(jī),不僅比上一次挑戰(zhàn)賽的冠軍算法(0.8074)優(yōu)秀,還比一位專業(yè)病理學(xué)醫(yī)生更準(zhǔn)確(0.7240)。目前,這一算法已經(jīng)在GitHub上開源,希望能促進(jìn)AI在病理分析的發(fā)展。
這項(xiàng)新的腫瘤檢測(cè)算法能讓醫(yī)生更多的關(guān)注算法高亮區(qū)域,而不是大海撈針?biāo)频脑谡鶊D像中搜尋腫瘤的痕跡。這對(duì)于提高病理檢測(cè)的效率和準(zhǔn)確性都有重要意義。未來我們將在更大的數(shù)據(jù)集上系統(tǒng)地評(píng)估這一算法,并且嘗試使用大于3×3的圖像網(wǎng)格作為輸入,因?yàn)樗軕?yīng)對(duì)更大的接受域,并能在癌癥轉(zhuǎn)移檢測(cè)中表現(xiàn)出更好地性能。
-
百度
+關(guān)注
關(guān)注
9文章
2377瀏覽量
94769 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5597瀏覽量
124342
發(fā)布評(píng)論請(qǐng)先 登錄
百度地圖開放平臺(tái)與400萬開發(fā)者共赴智能時(shí)空新未來
百度推出NCRF算法,癌癥轉(zhuǎn)移檢測(cè)準(zhǔn)確率喜人
評(píng)論