Fix retrying url

author: Gertjan van den Burg <gertjanvandenburg@gmail.com> 2019-03-05 14:43:59 -0500
committer: Gertjan van den Burg <gertjanvandenburg@gmail.com> 2019-03-05 14:43:59 -0500
commit: e9acd11858397a2cb6e617c717660e3027686413 (patch)
tree: 9577332a886f5d7b4b500f19e95ac190139fee60
parent: Add support for PubMed Central papers (diff)
download: paper2remarkable-e9acd11858397a2cb6e617c717660e3027686413.tar.gz
paper2remarkable-e9acd11858397a2cb6e617c717660e3027686413.zip
1 files changed, 15 insertions, 8 deletions
diff --git a/arxiv2remarkable.py b/arxiv2remarkable.py
index ea8b4c2..2b12919 100755
--- a/arxiv2remarkable.py
+++ b/arxiv2remarkable.py
@@ -124,20 +124,27 @@ def get_pmc_urls(url):
 
 def get_page_with_retry(url):
     """Get the content of an url, retrying up to five times on failure. """
+
+    def retry(url, count):
+        if count < 5:
+            logger.info("Caught error for url %s. Retrying in 5 seconds." % url)
+            time.sleep(5)
+        else:
+            exception("Failed to download url: %s" % url)
+
     count = 0
     while True:
-        res = requests.get(url, headers=HEADERS)
+        count += 1
+        try:
+            res = requests.get(url, headers=HEADERS)
+        except requests.exceptions.ConnectionError:
+            retry(url, count)
+            continue
         if res.ok:
             logger.info("Downloading url: %s" % url)
             return res.content
         else:
-            if count < 5:
-                logger.info(
-                    "Caught error for url %s. Retrying in 5 seconds." % url
-                )
-                time.sleep(5)
-            else:
-                exception("Failed to download url: %s" % url)
+            retry(url, count)
 
 
 def download_url(url, filename):
author	Gertjan van den Burg <gertjanvandenburg@gmail.com>	2019-03-05 14:43:59 -0500
committer	Gertjan van den Burg <gertjanvandenburg@gmail.com>	2019-03-05 14:43:59 -0500
commit	e9acd11858397a2cb6e617c717660e3027686413 (patch)
tree	9577332a886f5d7b4b500f19e95ac190139fee60
parent	Add support for PubMed Central papers (diff)
download	paper2remarkable-e9acd11858397a2cb6e617c717660e3027686413.tar.gz paper2remarkable-e9acd11858397a2cb6e617c717660e3027686413.zip