使用python測(cè)試網(wǎng)頁(yè)中超鏈接的連通性
在web測(cè)試,對(duì)網(wǎng)頁(yè)中的超鏈接進(jìn)行測(cè)試是最基本的工作,最簡(jiǎn)便的方法當(dāng)然是使用像xenu之類的工具。但它具體是怎么實(shí)現(xiàn)的呢?我想也無(wú)外乎是通過(guò)http協(xié)議,根據(jù)超鏈接地址,向服務(wù)端發(fā)送請(qǐng)求,然后根據(jù)返回的信息進(jìn)行判斷連接的狀態(tài)。下面是根據(jù)這種思路,用python編寫的檢測(cè)網(wǎng)頁(yè)鏈接連通性的程序。
首先,建立一個(gè)示例網(wǎng)頁(yè),其中l(wèi)ink1,lin3是不連通的,link2,link4是有效鏈接
使用python進(jìn)行鏈接檢測(cè),要使用到4個(gè)重要模塊,過(guò)程就是通過(guò)urllib抓取目標(biāo)網(wǎng)頁(yè)的html代碼,然后通過(guò)sgmllib模塊解析html,獲取超鏈接的列表。然后使用urlparse解析超鏈接的url,供httplib使用。然后由httplib模塊進(jìn)行最后的請(qǐng)求及驗(yàn)證回復(fù)的過(guò)程。
sgmllib:用于HTML解析,解析出網(wǎng)頁(yè)中包含的超鏈接
httplib:用于Http協(xié)議的操作
urllib:用于獲取網(wǎng)頁(yè)的html代碼
urlparse:解析url地址,把url地址解析成幾個(gè)部分。
具體實(shí)現(xiàn)代碼如下:
#-×-coding:gb2312-*-
importhttplib,urllib,urlparse
fromsgmllibimportSGMLParser
#解析指定的網(wǎng)頁(yè)的html,得到該頁(yè)面的超鏈接列表
classURLLister(SGMLParser):
defreset(self):
SGMLParser.reset(self)
self.urls=[]
defstart_a(self,attrs):
href=[vfork,vinattrsifk=='href']
ifhref:
self.urls.extend(href)
#遍歷超鏈接列表,并逐個(gè)的發(fā)送請(qǐng)求,判斷接收后的代碼,200為正常,其他為不正常
deffetch(host):
usock=urllib.urlopen(host)
parser=URLLister()
parser.feed(usock.read())
uhost=urlparse.urlparse(host)
forurlinparser.urls:
up=urlparse.urlparse(url)
#因?yàn)槌溄佑袃煞N方式:一種是直接的http://......一種是相對(duì)路徑,/.../sample.html
#所以要分別處理
ifup.netloc=="":
http=httplib.HTTP(uhost.netloc)
http.putrequest("GET","/"+up.path+"?"+up.params+up.query+up.fragment)
http.putheader("Accept","*/*")
http.endheaders()
else:
http=httplib.HTTP(up.netloc)
http.putrequest("GET",up.path+"?"+up.params+up.query+up.fragment)
http.putheader("Accept","*/*")
http.endheaders()
errcode,errmsg,headers=http.getreply()
iferrcode==200:
printurl,":ok"
else:
printurl,":",errcode
#測(cè)試
fetch("http://www.mobiletrain.org/")
代碼運(yùn)行的結(jié)果:
http://www.mobiletrain.org/erwerwe.html:404
/sample/lik.html:ok
/sample/lik2.html:404
http://www.mobiletrain.org/:ok
以上內(nèi)容為大家介紹了使用python測(cè)試網(wǎng)頁(yè)中超鏈接的連通性,希望對(duì)大家有所幫助,如果想要了解更多Python相關(guān)知識(shí),請(qǐng)關(guān)注IT培訓(xùn)機(jī)構(gòu):千鋒教育。http://www.mobiletrain.org/

猜你喜歡LIKE
相關(guān)推薦HOT
更多>>
Python如何輸出為文件
python輸出為文件使用withopen()as語(yǔ)句。使用示例:withopen('E:\python\python\test.txt','w')asf:f.writ...詳情>>
2023-11-09 22:08:08
怎么查看python變量的類型
python判斷變量的類型有兩種方法:type()和isinstance()對(duì)于基本的數(shù)據(jù)類型兩個(gè)的效果都一樣type()ip_port=['219.135.164.245',3128...詳情>>
2023-11-09 21:30:21
python如何生成文件夾
python中可以使用os.makedirs()方法創(chuàng)建多級(jí)目錄:os.makedirs()方法用于遞歸創(chuàng)建目錄。像mkdir(),但創(chuàng)建的所有intermediate-level文件夾需要包...詳情>>
2023-11-09 21:11:28
怎樣用python計(jì)算矩陣乘法?
python中計(jì)算矩陣乘法的方法:1、使用np.multiply()函數(shù)計(jì)算矩陣乘法函數(shù)作用:數(shù)組和矩陣對(duì)應(yīng)位置相乘,輸出與相乘數(shù)組/矩陣的大小一致示例:n...詳情>>
2023-11-09 20:01:23熱門推薦
python找不到指定模塊怎么辦
沸python如何將結(jié)果保存
熱python依賴安裝失敗怎么辦
熱怎么把python代碼打包
新Python如何輸出為文件
python如何檢測(cè)字符串是不是全為字母?
怎么查看python變量的類型
python如何生成文件夾
python如何獲取程序執(zhí)行時(shí)間?
Python中猴子補(bǔ)丁是什么?
python字典打印亂碼怎么解決
怎樣用python計(jì)算矩陣乘法?
python如何調(diào)用另一個(gè)文件夾中的內(nèi)容?
python如何去空格和回車?
快速通道 更多>>
-
課程介紹
點(diǎn)擊獲取大綱 -
就業(yè)前景
查看就業(yè)薪資 -
學(xué)習(xí)費(fèi)用
了解課程價(jià)格 -
優(yōu)惠活動(dòng)
領(lǐng)取優(yōu)惠券 -
學(xué)習(xí)資源
領(lǐng)3000G教程 -
師資團(tuán)隊(duì)
了解師資團(tuán)隊(duì) -
實(shí)戰(zhàn)項(xiàng)目
獲取項(xiàng)目源碼 -
開(kāi)班地區(qū)
查看來(lái)校路線