您现在的位置： Linux教程網 >> UnixLinux > >> Linux編程 >> Linux編程

Python 頻繁請求問題: [Errno 104] Connection reset by peer

記遇到的一個問題:[Errno 104] Connection reset by peer

今天工作上有個需求，數據庫有個表有將近3萬條url記錄，每條記錄都是一個圖片，我需要請求他們拿到每個圖片存到本地。一開始我是這麼寫的(偽代碼):

import requests

for url in urls:
    try:
        r = requests.get(url).content
        save_image(r)
    except Exception, e:
        print str(e)

然而在服務器上運行時, 會發現每隔一些請求會報類似下面的錯誤:

HTTPConnectionPool(host='wx.qlogo.cn', port=80): Max retries exceeded with url: /mmopen/aTVWntpJLCAr2pichIUx8XMevb3SEbktTuLkxJLHWVTwGfkprKZ7rkEYDrKRr5icyDGIvU4iasoyRrqsffbe3UUQXT5EfMEbYKg/0 (Caused by <class 'socket.error'>: [Errno 104] Connection reset by peer)

這讓我想起了之前通過hacker news api 在自己電腦上請求一條一條數據時，為了加快處理速度，采用多進程的方式請求接口，也會出現這樣的錯誤。之前我是做了錯誤記錄直接pass了，這次情況下因為需要請求所有圖片，在google查了相關原因，大概是因為我頻繁請求，服務器關閉了部門請求連接。參見這裡，這裡，這裡。
所以我粗暴地這麼做，還真解決了：

import requests

for url in urls:
    for i in range(10):
        try:
            r = requests.get(url).content
        except Exception, e:
            if i >= 9:
                do_some_log()
            else:
                time.sleep(0.5)
        else:
            time.sleep(0.1)
            break

     save_image(r)

代碼很簡陋，但可以說明大體解決方案，在每個請求間增加延時可以減少大部分請求拒絕，但還是存在一些請求被拒絕的，所以在那部分請求被拒絕後，發起重試，在被拒10次後才善罷甘休（記錄到日志）。在實際的請求中，加了0.1s的延遲被拒絕的情況明顯少了很多，被拒絕重試的次數最多為3次，最後成功地取下了全部圖片。

上一篇文章：內存映射mmap
下一篇文章： Python os模塊進程函數

Linux編程

為什麼apache錯誤日志裡面出現“connection reset by peer”

ssh_exchange_identification: read: Connection reset by peer

Python入門(一)----什麼是python?python及模塊的安裝

Python IDLE 清屏問題

Python 之Vim編寫Python自動補全

Python實現蒙提霍爾問題

對比 Python 和 Go 語言的每秒請求數

Python發送HTTP請求

相關文章

python的問題

關於python的問題

Python求解進制問題（阿裡巴巴2015筆試題）

Python高級進階：細說Python淺拷貝和深拷貝

Python面試必須要看的15個問題

為什麼說 Python 4.0 不會像 Python 3.0 一樣

Python類繼承時構造函數的執行問題

Python顯示\u897f類字符問題的解決方法

Python 2.6.6安裝MySQL-python模塊

Python基礎：Python的變量和對象

Python基礎：Python可變對象和不可變對象

Python 處理 SIGKILL 時遇到的問題

Linux編程

SHELL編程

PERL編程