Python3 默認(rèn)提供了urllib庫(kù),可以爬取網(wǎng)頁(yè)信息,但其中確實(shí)有不方便的地方,如:處理網(wǎng)頁(yè)驗(yàn)證和Cookies,以及Hander頭信息處理。
為了更加方便處理,有了更為強(qiáng)大的庫(kù) urllib3 和 requests, 本節(jié)會(huì)分別介紹一下,以后我們著重使用requests。
1. urllib3庫(kù)的使用:
- 安裝:通過(guò)使用pip命令來(lái)安裝urllib3
pip install urllib3
- 簡(jiǎn)單使用:
import urllib3
import re
# 實(shí)例化產(chǎn)生請(qǐng)求對(duì)象
http = urllib3.PoolManager()
# get請(qǐng)求指定網(wǎng)址
url = "http://www.baidu.com"
res = http.request("GET",url)
# 獲取HTTP狀態(tài)碼
print("status:%d" % res.status)
# 獲取響應(yīng)內(nèi)容
data = res.data.decode("utf-8")
# 正則解析并輸出
print(re.findall("
",data))
- 其他設(shè)置: 增加了超時(shí)時(shí)間,請(qǐng)求參數(shù)等設(shè)置
import urllib3
import re
url = "http://www.baidu.com"
http = urllib3.PoolManager(timeout = 4.0) #設(shè)置超時(shí)時(shí)間
res = http.request(
"GET",
url,
#headers={
# 'User-Agent':'Mozilla/5.0(WindowsNT6.1;rv:2.0.1)Gecko/20100101Firefox/4.0.1',
#},
fields={'id':100,'name':'lisi'}, #請(qǐng)求參數(shù)信息
)
print("status:%d" % res.status)
data = res.data.decode("utf-8")
print(re.findall("
",data))
2. requests庫(kù)的使用:
- 安裝:通過(guò)使用pip命令來(lái)安裝requests
pip install requests
- 簡(jiǎn)單使用:
import requests
import re
url = "http://www.baidu.com"
# 抓取信息
res = requests.get(url)
#獲取HTTP狀態(tài)碼
print("status:%d" % res.status_code)
# 獲取響應(yīng)內(nèi)容
data = res.content.decode("utf-8")
#解析出結(jié)果
print(re.findall("
",data))
審核編輯:湯梓紅
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
-
信息
+關(guān)注
關(guān)注
0文章
409瀏覽量
36429 -
python
+關(guān)注
關(guān)注
58文章
4882瀏覽量
90290
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
熱點(diǎn)推薦
如何在 Vision Five 2 上安裝 python 庫(kù)?
這可能是一個(gè)完全愚蠢的問(wèn)題,但我如何在 Vision Five 2 上安裝 python 庫(kù)。
使用該命令后,它給了我這個(gè)錯(cuò)誤。
默認(rèn)為用戶(hù)安裝,因?yàn)槠胀ㄕ军c(diǎn)包不可寫(xiě)
錯(cuò)誤:找不到滿(mǎn)足要求
發(fā)表于 03-06 07:51
無(wú)法去除 Python VisionFive.i2c 庫(kù)的終端輸出?
燒的官方最新八月份的 debian 12 的系統(tǒng)。
根據(jù)這個(gè)案例安裝好了 python 環(huán)境和 VisionFive 庫(kù)。
執(zhí)行下面這條代碼:
import VisionFive.i2c
發(fā)表于 02-25 06:13
微庫(kù)與標(biāo)準(zhǔn)C庫(kù)的區(qū)別
主要的差異:
1.代碼(數(shù)據(jù))量更?。▽?duì)比上圖)。
2.缺少一些不常用標(biāo)準(zhǔn)庫(kù)函數(shù),比如:文件 I/O 的庫(kù)函數(shù)。
3.微庫(kù)最大程度優(yōu)化代碼量,可能會(huì)導(dǎo)致有些庫(kù)代碼運(yùn)行速度更慢。
4.可用于RTOS這類(lèi)
發(fā)表于 12-09 07:49
Python調(diào)用API教程
兩個(gè)不同系統(tǒng)之間的信息交互。在這篇文章中,我們將詳細(xì)介紹Python調(diào)用API的方法和技巧。 一、用Requests庫(kù)發(fā)送HTTP請(qǐng)求 使用Pyth
目前最新版的userapps如何安裝D1s環(huán)境?
Traceback (most recent call last):
File \"/usr/lib/python3/dist-packages/urllib3/connection.py\"
發(fā)表于 09-25 07:33
數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—服務(wù)器異常斷電導(dǎo)致Oracle數(shù)據(jù)庫(kù)故障的數(shù)據(jù)恢復(fù)案例
備份,僅有一些斷斷續(xù)續(xù)的歸檔日志。
Oracle數(shù)據(jù)庫(kù)恢復(fù)流程:
1、檢測(cè)數(shù)據(jù)庫(kù)故障情況;
2、嘗試掛起并修復(fù)數(shù)據(jù)庫(kù);
3、解析數(shù)據(jù)庫(kù)
linux虛擬環(huán)境中調(diào)用Linux 版matlab編譯的python庫(kù)時(shí)出錯(cuò)
matlab代碼編譯為CAO_python的python庫(kù),其中cp_Main_python.m為入口文件,編譯后生成的文件有mccExcludedFiles.log、setup.py
發(fā)表于 07-18 10:40
數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—MongoDB數(shù)據(jù)庫(kù)文件丟失的數(shù)據(jù)恢復(fù)案例
MongoDB數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)環(huán)境:
一臺(tái)操作系統(tǒng)為Windows Server的虛擬機(jī)上部署MongoDB數(shù)據(jù)庫(kù)。
MongoDB數(shù)據(jù)庫(kù)故障:
工作人員在MongoDB服務(wù)仍然開(kāi)啟的情況下
數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—SQL Server數(shù)據(jù)庫(kù)被加密如何恢復(fù)數(shù)據(jù)?
SQL Server數(shù)據(jù)庫(kù)故障:
SQL Server數(shù)據(jù)庫(kù)被加密,無(wú)法使用。
數(shù)據(jù)庫(kù)MDF、LDF、log日志文件名字被篡改。
自己寫(xiě)庫(kù):構(gòu)建庫(kù)函數(shù)雛形
實(shí)際上,構(gòu)建固件庫(kù)是一件費(fèi)時(shí)費(fèi)力的事情,并且它對(duì)開(kāi)發(fā)者對(duì)芯片的熟悉程度有一定的要求。甚至,當(dāng)一個(gè)固件庫(kù)的封裝程度很高時(shí),想要閱讀并理解該固件庫(kù)的底層代碼也會(huì)變成一件有較高難度的事情。瑞薩RA系列
基于STM32 HAL庫(kù)與標(biāo)準(zhǔn)庫(kù)的esp8266接入機(jī)智云方案(二)
在《基于STM32HAL庫(kù)與標(biāo)準(zhǔn)庫(kù)的esp8266接入機(jī)智云方案(一)》中,我們?cè)敿?xì)介紹了硬件連接和機(jī)智云客戶(hù)端的創(chuàng)建。本篇將重點(diǎn)講解如何下載代碼、分析下載的代碼,并直接使用這些代碼連接機(jī)智云。同時(shí)
MySQL數(shù)據(jù)庫(kù)是什么
開(kāi)發(fā)、企業(yè)應(yīng)用和大數(shù)據(jù)場(chǎng)景。以下是其核心特性和應(yīng)用場(chǎng)景的詳細(xì)說(shuō)明: 核心特性 關(guān)系型數(shù)據(jù)庫(kù)模型 數(shù)據(jù)以 表(Table) 形式組織,表由行(記錄)和列(字段)構(gòu)成。 通過(guò) 主鍵、外鍵 實(shí)現(xiàn)表間關(guān)聯(lián),支持復(fù)雜查詢(xún)和事務(wù)處理。 示例 :電商系統(tǒng)中,用戶(hù)表、訂單表、商品表
python中urllib3庫(kù)和requests庫(kù)的使用
評(píng)論