近日,Github出爐報(bào)告,統(tǒng)計(jì)了2018年最受歡迎的編程語言、使用最廣的軟件包和貢獻(xiàn)者最多的熱門項(xiàng)目Top10。Python、Numpy和Tensorflow分別位列第一,可謂眾望所歸。C++、Java、Pandas、Scikit-learn等熱門語言、庫和項(xiàng)目均進(jìn)入Top10。
在我們2018年的Octoverse報(bào)告中,機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)成為GitHub上的熱門話題。 tensorflow是貢獻(xiàn)最大的項(xiàng)目之一,pytorch 是增長最快的項(xiàng)目之一,Python是GitHub上第三大最受歡迎的語言。我們決定在GitHub上繼續(xù)深入研究機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)的現(xiàn)狀。
我們抓取了2018年1月1日到2018年12月31日之間的貢獻(xiàn)數(shù)據(jù)。這里的貢獻(xiàn)可能包括推送代碼、提出問題或提取請求,評論問題或提取請求,或?qū)彶樘崛≌埱?。對于大多?shù)導(dǎo)入包,我們使用了依賴關(guān)系圖中的數(shù)據(jù),其中包括所有公共存儲庫和已選擇加入依賴關(guān)系圖的全部私有存儲庫。
最受歡迎的機(jī)器學(xué)習(xí)編程語言:Python居首
2018年GitHub上最受歡迎的機(jī)器學(xué)習(xí)語言
我們查看了使用“機(jī)器學(xué)習(xí)”主題標(biāo)記的存儲庫的貢獻(xiàn)者,并對存儲庫中最常見的主要語言進(jìn)行了排名。Python是機(jī)器學(xué)習(xí)資源庫中最常用的語言,也是GitHub上第三常用的語言。然而,并非所有機(jī)器學(xué)習(xí)項(xiàng)目都使用Python:GitHub上的一些最常見的語言也是機(jī)器學(xué)習(xí)項(xiàng)目的通用語言。
C ++,JavaScript,Java,C#,Shell和TypeScript等語言都位列GitHub上最常使用的語言前10名,它們也位列機(jī)器學(xué)習(xí)項(xiàng)目最常用語言的前10名。
Julia、R和Scala等語言也位列機(jī)器學(xué)習(xí)項(xiàng)目的前10名,但沒有進(jìn)入整個(gè)GitHub使用語言的前十。 Julia和R都是數(shù)據(jù)科學(xué)家常用的語言,而Scala在與Apache Spark等語言在大數(shù)據(jù)系統(tǒng)交互下的應(yīng)用越來越普遍。
使用最廣泛的機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)軟件包:Numpy第一
2018年導(dǎo)入Github資源庫的頂級軟件包
我們從依賴圖中提取數(shù)據(jù),計(jì)算出導(dǎo)入流行Python包的機(jī)器學(xué)習(xí)或數(shù)據(jù)科學(xué)主題的項(xiàng)目百分比。上面的列表顯示了這些項(xiàng)目導(dǎo)入的前十個(gè)包。結(jié)果如下圖所示:
Numpy是一個(gè)支持多維數(shù)據(jù)數(shù)學(xué)運(yùn)算的軟件包,是被導(dǎo)入次數(shù)最多的包,被用于近四分之三的機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)項(xiàng)目中。
Scipy是一個(gè)用于科學(xué)計(jì)算的軟件包,Pandas是一個(gè)用于管理數(shù)據(jù)集的軟件包,matplotlib是一個(gè)可視化庫,這三個(gè)包被用于超過40%的機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)項(xiàng)目中。
Scikit-learn是一種非常流行的機(jī)器學(xué)習(xí)包,包含大量機(jī)器學(xué)習(xí)算法實(shí)現(xiàn),近40%的項(xiàng)目使用它。
Tensorflow是一種用于處理神經(jīng)網(wǎng)絡(luò)的軟件包,有近四分之一的軟件包使用它。
前十名中的其他包都是功能性程序包:其中六個(gè)是Python 2和3兼容性庫,python-dateutil和pytz是用于處理日期的包。
最受歡迎的機(jī)器學(xué)習(xí)項(xiàng)目:Tensorflow折桂
2018年GitHub上的頂級機(jī)器學(xué)習(xí)項(xiàng)目
我們還考察了2018年“機(jī)器學(xué)習(xí)”標(biāo)簽下貢獻(xiàn)者最多的開源項(xiàng)目。Tensorflow是迄今為止最受歡迎的項(xiàng)目,是排名第二的scikit-learn的貢獻(xiàn)者數(shù)量的5倍多。
explosion/spaCy和RasaHQ /rasa_nlu這兩個(gè)項(xiàng)目專注于自然語言處理問題。
另外四個(gè)項(xiàng)目,CMU-Perceptual-Computing-Lab / openpose,thtrieu / darkflow,ageitgey / face_recognition和tesseract-ocr / tesseract,專注于圖像處理。 Julia語言源代碼項(xiàng)目也是2018年貢獻(xiàn)者最多的項(xiàng)目之一。
-
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8551瀏覽量
136823 -
GitHub
+關(guān)注
關(guān)注
3文章
488瀏覽量
18616 -
數(shù)據(jù)科學(xué)
+關(guān)注
關(guān)注
0文章
168瀏覽量
10787
原文標(biāo)題:Github機(jī)器學(xué)習(xí)年度熱門排行:最熱編程語言Python第一
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
RT-Thread Vector軟件包:嵌入式開發(fā)的動態(tài)數(shù)組容器 | 技術(shù)集結(jié)
瑞薩靈活配置軟件包FSP 6.2.0版本的更新內(nèi)容
Github2018年最熱語言\軟件包\項(xiàng)目top 10盤點(diǎn)
評論