chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用TensorFlow 2識別驗證碼過程中踩過的坑

Tensorflowers ? 來源:TensorFlow ? 作者:TensorFlow ? 2020-10-22 16:47 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在學(xué)習(xí)了 CNN 之后,我一直想去做一個驗證碼識別。網(wǎng)上找了很多資料,雜七雜八的一大堆,但是好多是 tf1 寫的。我對 tf1 不太熟悉,于是自己開始了基于 TensorFlow 2 的摸索實踐。

摸索的過程異常艱難,一開始我直接用 captcha 生成了 10080 張驗證碼去識別,發(fā)現(xiàn) loss 一直停留在 2.3 左右,accuracy 一直是 0.1 左右,訓(xùn)練了 100 回合,也沒什么提升,電腦都快要跑廢了,咋辦呀?于是網(wǎng)上各種問大佬,找到機(jī)會就提問,其中一位大佬的回答讓我受到了啟發(fā),他說:你可以先識別 1 位,然后 2 位,3 位,最后 4 位,一步一步來……。

本文主要描述我在驗證碼識別過程中的一些摸索,整理出來以供大家參考:

第一回:搭建網(wǎng)絡(luò)結(jié)構(gòu)

首先我們需要搭建網(wǎng)絡(luò)結(jié)構(gòu),如下:

model=tf.keras.models.Sequential([ tf.keras.Input(shape=(H, W, C)), layers.Conv2D(32, 3, activation='relu'), layers.MaxPooling2D((2, 2)), layers.Conv2D(64, 3, activation='relu'), layers.MaxPooling2D((2, 2)), layers.Conv2D(64, 3, activation='relu'), layers.MaxPooling2D((2, 2)), layers.Conv2D(64, 3, activation='relu'), layers.MaxPooling2D((2, 2)), layers.Conv2D(64, 3, activation='relu'), layers.MaxPooling2D((2, 2)), layers.Flatten(), layers.Dense(1024, activation='relu'), layers.Dense(D * N_LABELS, activation='softmax'), layers.Reshape((D, N_LABELS)), ]) model.compile(optimizer='adam', loss='categorical_crossentropy', metrics= ['accuracy']) callbacks=[ tf.keras.callbacks.TensorBoard(log_dir='logs'), tf.keras.callbacks.ModelCheckpoint(filepath=check_point_path, save_weights_only=True, save_best_only=True) ] history = model.fit(train_gen, steps_per_epoch=len(train_idx)//batch_size, epochs=100, callbacks=callbacks, validation_data=valid_gen, validation_steps=len(valid_idx)//valid_batch_size)

summary:

我的訓(xùn)練數(shù)據(jù)量:train count: 7408, valid count: 3176, test count: 4536

樣本圖:

訓(xùn)練結(jié)果:

Train for 231 steps, validate for 99 steps Epoch 1/100 1/231 […] - ETA: 4:18 - loss: 2.2984 - accuracy: 0.1328 231/231 [==============================] - 143s 618ms/step - loss: 2.3032 - accuracy: 0.0971 - val_loss: 2.3029 - val_accuracy: 0.0987 Epoch 2/100 230/231 [============================>.] - ETA: 0s - loss: 2.3026 - accuracy: 0.1014 231/231 [==============================] - 121s 525ms/step - loss: 2.3026 - accuracy: 0.1013 - val_loss: 2.3031 - val_accuracy: 0.0986 Epoch 3/100 230/231 [============================>.] - ETA: 0s - loss: 2.3026 - accuracy: 0.1029 231/231 [==============================] - 138s 597ms/step - loss: 2.3026 - accuracy: 0.1026 - val_loss: 2.3032 - val_accuracy: 0.0986 Epoch 4/100 230/231 [============================>.] - ETA: 0s - loss: 2.3025 - accuracy: 0.1031 231/231 [==============================] - 124s 537ms/step - loss: 2.3025 - accuracy: 0.1031 - val_loss: 2.3032 - val_accuracy: 0.0987 Epoch 5/100 230/231 [============================>.] - ETA: 0s - loss: 2.3025 - accuracy: 0.1040 231/231 [==============================] - 123s 532ms/step - loss: 2.3025 - accuracy: 0.1039 - val_loss: 2.3032 - val_accuracy: 0.0989 Epoch 6/100 230/231 [============================>.] - ETA: 0s - loss: 2.3025 - accuracy: 0.1039 231/231 [==============================] - 118s 509ms/step - loss: 2.3025 - accuracy: 0.1038 - val_loss: 2.3033 - val_accuracy: 0.0988 … Epoch 20/100 230/231 [============================>.] - ETA: 0s - loss: 2.3025 - accuracy: 0.1038 231/231 [==============================] - 120s 521ms/step - loss: 2.3025 - accuracy: 0.1038 - val_loss: 2.3034 - val_accuracy: 0.0988 Epoch 21/100 190/231 [=======================>…] - ETA: 20s - loss: 2.3025 - accuracy: 0.1032

loss 一直沒有變化,accuracy 也很低,不知道出現(xiàn)了什么原因,困擾一兩個星期,都想要放棄了,太難了。但是我不死心,非要把它搞出來,4 位識別不出來,能不能先識別一位呢?好,那就開始搞,一位比較簡單,跟 Mnist 數(shù)據(jù)集很相似,在這我就不贅述了。

第二回:2 位彩色驗證碼訓(xùn)練

接著來識別 2 位的驗證碼。train count: 441, valid count: 189, test count: 270

樣本圖:

下面是我用 2 位驗證碼進(jìn)行訓(xùn)練的結(jié)果:

30 張圖片進(jìn)行測試,結(jié)果:

哎呦,有感覺了,有了起色了,但是出現(xiàn)了過擬合的現(xiàn)象,解決過擬合的方法主要有:

Get more training data

Reduce the capacity of the network

Add weight regularization

Add dropout

Data-augmentation

Batch normalization

第三回:增加彩色驗證碼數(shù)據(jù)集

于是我就增加了數(shù)據(jù)集。train count: 4410, valid count: 1890, test count: 2700

然后又出現(xiàn)了 loss 一直在 2.3,accuracy 在 0.09 左右,這是什么鬼呢?但是我還是不死心呀,繼續(xù)想辦法呀,既然彩色的有難度,我先識別黑白的樣本行不行呢,先試試吧。

第四回:2 位黑白驗證碼訓(xùn)練

網(wǎng)絡(luò)結(jié)構(gòu)依然采用上面的,input_shape(100,120,3)。

這是我用 2 位的黑白圖片的驗證碼進(jìn)行了訓(xùn)練,效果很好,收斂也很快。

訓(xùn)練第 50 回合時:

Epoch 50/50 26/27 [============>…] - ETA: 0s - loss: 0.0150 - accuracy: 0.9940 27/27 [==============] - 8s 289ms/step - loss: 0.0212 - accuracy: 0.9936 - val_loss: 0.2348 - val_accuracy: 0.9446

隨機(jī)選取了 30 張圖片進(jìn)行了測試,2 張識別錯了:

樣本圖:

看著這結(jié)果,我露出了潔白的大牙,信心大增呀,繼續(xù)搞,直接上 4 位驗證碼。

第五回:4 位黑白驗證碼訓(xùn)練

依然采用上面的網(wǎng)絡(luò)結(jié)構(gòu),這次使用的是 4 位黑白圖片的驗證碼。train count: 2469, valid count: 1059, test count: 1512

訓(xùn)練第 20 回合:

Epoch 20/20 76/77 [====>.] - ETA: 0s - loss: 0.0409 - accuracy: 0.9860 77/77 [======] - 33s 429ms/step - loss: 0.0408 - accuracy: 0.9861 - val_loss: 0.3283 - val_accuracy: 0.9221

隨機(jī)選取 30 張圖片進(jìn)行測試,8 張錯誤:

4 位驗證碼的樣本圖:

從結(jié)果來看,有點(diǎn)過擬合,沒關(guān)系,繼續(xù)加大數(shù)據(jù)集。

第六回:增加黑白驗證碼數(shù)據(jù)集

依舊采用上面的網(wǎng)絡(luò)結(jié)構(gòu),這次我增加了數(shù)據(jù)集 4939 張,依舊使用的是 4 位黑白的驗證碼,訓(xùn)練結(jié)果還是挺好的:train count: 4939, valid count: 2117, test count: 3024

第 20 回合:

Epoch 20/20 153/154 [==>.] - ETA: 0s - loss: 0.0327 - accuracy: 0.9898 154/154 [====] - 75s 488ms/step - loss: 0.0329 - accuracy: 0.9898 - val_loss: 0.1057 - val_accuracy: 0.9740

可以看出 訓(xùn)練集的準(zhǔn)確率 跟驗證集上很接近,隨機(jī)選取 30 張圖片進(jìn)行測試,6 張錯誤圖如下:

好了,搞了這么多,由此我覺得是噪點(diǎn)影響了深度學(xué)習(xí)的識別,maxpool 的時候連帶著噪點(diǎn)也采樣了,我們需要將噪點(diǎn)處理掉,再喂入神經(jīng)網(wǎng)絡(luò)

第七回:預(yù)處理

在上面的推理中,我感覺是噪點(diǎn)影響了神經(jīng)網(wǎng)絡(luò)的識別,于是乎我在送入網(wǎng)絡(luò)之前進(jìn)行了去噪,二值化操作,訓(xùn)練如下:train count: 4939, valid count: 2117, test count: 3024

從圖中可以看出,模型收斂了,但有點(diǎn)過擬合,第 20 回合訓(xùn)練結(jié)果如下:

Epoch 20/20 153/154 [==>.] - ETA: 0s - loss: 0.0407 - accuracy: 0.9861 154/154 [===] - 69s 450ms/step - loss: 0.0408 - accuracy: 0.9860 - val_loss: 0.3227 - val_accuracy: 0.9244

隨機(jī)選取了 30 張圖片進(jìn)行了測試,8 張錯誤:

做到這里, 我對之前的推測有了猜疑:是噪點(diǎn)影響的嗎?我覺得不完全是。核心原因是我在嘗試的過程中對驗證碼進(jìn)行了處理,從 RGB 的驗證碼變成了單通道的黑白驗證碼,使得圖片的信息減少了,神經(jīng)網(wǎng)絡(luò)的計算量也大大減少了,網(wǎng)絡(luò)模型很快得到了收斂,loss 顯著減少,accuracy 在不斷提高。

整個過程是使用 CPU 進(jìn)行訓(xùn)練的,電腦配置是 Intel_Corei7-6700HQ_CPU@_2.60GHz,8G 內(nèi)存。如果大家的電腦配置高,用 GPU 進(jìn)行訓(xùn)練,我覺得即使不做預(yù)處理,效果也能出來。


責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cnn
    cnn
    +關(guān)注

    關(guān)注

    3

    文章

    355

    瀏覽量

    23264
  • tensorflow
    +關(guān)注

    關(guān)注

    13

    文章

    332

    瀏覽量

    61872
  • 驗證碼
    +關(guān)注

    關(guān)注

    2

    文章

    20

    瀏覽量

    4869

原文標(biāo)題:經(jīng)驗總結(jié):使用 TensorFlow 2 識別驗證碼過程中踩過的坑

文章出處:【微信號:tensorflowers,微信公眾號:Tensorflowers】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    工業(yè)電子EMC整改:工業(yè)場景下90%工程師的雷區(qū)

    工業(yè)電子EMC整改:工業(yè)場景下90%工程師的雷區(qū)|深圳南柯電子
    的頭像 發(fā)表于 12-16 10:07 ?47次閱讀

    STM32 5 個容易的外設(shè)使用技巧

    STM32是嵌入式開發(fā)領(lǐng)域的熱門MCU,功能豐富到幾乎可以完成所有常見控制任務(wù):GPIO、ADC、UART、定時器、DMA……應(yīng)有盡有。但是,正因為功能強(qiáng)大,開發(fā)的機(jī)會也隨之增多。很多初學(xué)者
    的頭像 發(fā)表于 11-24 19:04 ?557次閱讀
    STM32 5 個容易<b class='flag-5'>踩</b><b class='flag-5'>坑</b>的外設(shè)使用技巧

    為什么360°鏡頭容易“”?

    核心參數(shù)一:焦距與視場角-解決“看多廣”與“看多清”的矛盾這是第一個,也是最容易選錯的參數(shù)。誤區(qū):認(rèn)為360°鏡頭的焦距和普通鏡頭一樣。真相:360°鏡頭的焦距極短(通常為1-2mm左右),我們用
    的頭像 發(fā)表于 11-18 11:29 ?221次閱讀
    為什么360°鏡頭容易“<b class='flag-5'>踩</b><b class='flag-5'>坑</b>”?

    JLink、RV Debugger及串口下載使用體驗和

    自己搭配調(diào)試器或串口工具來進(jìn)行,雖然造成了一定麻煩,卻也是學(xué)習(xí)()的好機(jī)會。 以下將以調(diào)試器為順序,簡單敘述使用感受及過程中
    發(fā)表于 11-05 12:04

    【嘉楠堪智K230開發(fā)板試用體驗】+二維識別

    二維識別 二維識別本質(zhì)上是一個通過圖像處理技術(shù)定位并矯正圖像的二維區(qū)域,然后根據(jù)其特定編
    發(fā)表于 08-22 20:16

    自動化測試如何繞過Cloudflare驗證碼?Python + Selenium 腳本實戰(zhàn)指南!

    01什么是Cloudflare驗證碼Cloudflare提供網(wǎng)絡(luò)工具,并提供一套全面的安全功能,以保護(hù)網(wǎng)站免受各種在線威脅。Cloudflare驗證碼是一種用于區(qū)分人類用戶和自動化機(jī)器人的功能。它是
    的頭像 發(fā)表于 08-15 10:01 ?940次閱讀
    自動化測試如何繞過Cloudflare<b class='flag-5'>驗證碼</b>?Python + Selenium 腳本實戰(zhàn)指南!

    UWB自動跟隨技術(shù)原理、算法融合優(yōu)化和實錄

    UWB為什么是最靠譜的自動跟隨技術(shù)?原理是什么?需要做什么算法融合、優(yōu)化?我們在開發(fā)過程中
    的頭像 發(fā)表于 08-14 17:45 ?1161次閱讀
    UWB自動跟隨技術(shù)原理、算法融合優(yōu)化和<b class='flag-5'>踩</b><b class='flag-5'>坑</b>實錄

    PLC工業(yè)智能網(wǎng)關(guān):功能解析、場景落地與選型避攻略

    如何避免選型?本文從技術(shù)原理、核心價值、典型場景、避指南四大維度,結(jié)合真實案例與行業(yè)趨勢,為您徹底拆解PLC工業(yè)智能網(wǎng)關(guān)的“真面目”。
    的頭像 發(fā)表于 07-16 13:21 ?497次閱讀
    PLC工業(yè)智能網(wǎng)關(guān):功能解析、場景落地與選型避<b class='flag-5'>坑</b>攻略

    使用Word/Excel管理需求的10個痛點(diǎn)及解決方案Perforce ALM

    還在用Word/Excel做需求管理?10個“翻車信號”,都是小伙伴們~來看看你哪些?是不是也該升級到更專業(yè)的ALM工具了~
    的頭像 發(fā)表于 07-10 15:59 ?538次閱讀
    使用Word/Excel管理需求的10個痛點(diǎn)及解決方案Perforce ALM

    GM861條二維識別模塊用戶手冊

    GM861條二維識別模塊用戶手冊
    發(fā)表于 07-09 14:56 ?0次下載

    HarmonyOS5云服務(wù)技術(shù)分享--登錄郵件功能整理

    agconnect-services.json文件(參考官方集成文檔)。 ??二、郵箱認(rèn)證全流程實現(xiàn)?? ??1. 注冊郵箱賬號?? ??核心邏輯??:驗證郵箱有效性 → 發(fā)送驗證碼 → 創(chuàng)建用戶
    發(fā)表于 05-22 16:04

    HarmonyOS5云服務(wù)技術(shù)分享--手機(jī)號登錄教程

    ;requestPermissions\": [ {\"name\": \"ohos.permission.READ_SMS\"} // 如果需要自動讀取短信驗證碼 ]` 三、核心
    發(fā)表于 05-22 15:37

    實驗過程中DLP Discovery 4100開發(fā)板的電源撥開關(guān)sw4連帶焊盤一塊脫落,怎么解決?

    實驗過程中DLP Discovery 4100開發(fā)板的電源撥開關(guān)sw4連帶焊盤一塊脫落,請問有什么補(bǔ)救措施嗎?
    發(fā)表于 02-28 07:06

    不管是LTC6912還是AFE5801通SPI總線對reg進(jìn)行寫的時候,在寫的過程中,AFE5801還在工作狀態(tài)嗎?

    不管是LTC6912還是AFE5801通SPI總線對reg進(jìn)行寫的時候,在寫的過程中,AFE5801還在工作狀態(tài)嗎?被寫的這個reg里的值是保持在上一時刻寫入的數(shù)據(jù)還是不定態(tài)?現(xiàn)在采用Static PGA模式寫TVG曲線,需要每隔一段時間更新增益值。在寫的
    發(fā)表于 02-11 07:24

    手機(jī)喇叭氣密性檢測儀選購攻略,避免!

    在智能手機(jī)的生產(chǎn)過程中,手機(jī)喇叭作為其重要的發(fā)聲部件,其氣密性直接影響著手機(jī)的音質(zhì)和耐用性。為了確保產(chǎn)品質(zhì)量,企業(yè)需要采用氣密性檢測儀對手機(jī)喇叭進(jìn)行檢測。然而,市場上氣密性檢測儀品牌眾多,價格
    的頭像 發(fā)表于 02-05 17:04 ?991次閱讀
    手機(jī)喇叭氣密性檢測儀選購攻略,避免<b class='flag-5'>踩</b><b class='flag-5'>坑</b>!