python-快速使用urllib爬取网页(8-URLError)
发布日期:2021-06-29 12:30:06 浏览次数:3 分类:技术文章

本文共 675 字,大约阅读时间需要 2 分钟。

程序的执行难免遇到异常,发生异常不要紧,关键是要合理处理异常

在Python爬虫中,经常要处理与URL相关的异常

使用URL异常处理-URLError类进行处理
导入urllib.error模块

本节我们主要介绍两个类:URLError + HTTPError

import urllib.requestimport urllib.errortry:    urllib.request.urlopen("http://blog.csdn.net")except urllib.error.URLError as e:    print(e.code)    print(e.reason)

运行上述代码,出现403错误

产生URLError错误的原因:

a、连不上服务器
b、远程URL不存在
c、无网络
d、出发了HTTPError
上面例子就是触犯了HTTPError所导致

403是状态码

我们来总结一下各种状态码的含义

200 OK 一切正常
301 Moved Permanently 重定向到新的URL,永久性
302 Found 重定向到临时的URL,非永久性
304 Not Modified 请求的资源未更新
400 Bad Request 非法请求
401 Unauthorized 请求未经授期
403 Forfidden 禁止访问
404 Not Found 没有找到对应的页面
500 Internal Server Error 服务器内部出现错误
501 Not Implemented 服务器不支持实现请求所需要的功能

转载地址:https://bupt-xbz.blog.csdn.net/article/details/78883867 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!

上一篇:python-快速使用urllib爬取网页(小结)
下一篇:python-快速使用urllib爬取网页(7-DebugLog)

发表评论

最新留言

不错!
[***.144.177.141]2024年04月07日 20时28分32秒

关于作者

    喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!

推荐文章

和总裁、专家交朋友,华为云助推政企智能化升级又做到前面去了 2019-04-29
BCOP章鱼船长,6月22日晚上8点上线薄饼 2019-04-29
为战疫助力,半导体功不可没 2019-04-29
了解这些操作,Python中99%的文件操作都将变得游刃有余! 2019-04-29
知道如何操作还不够!深入了解4大热门机器学习算法 2019-04-29
只有经历过,才能深刻理解的9个编程道理 2019-04-29
发现超能力:这些数据科学技能助你更高效专业 2019-04-29
AI当道,人工智能将如何改变金融业? 2019-04-29
消除性别成见,技术领域需要更多“乘风破浪的姐姐” 2019-04-29
7行代码击败整个金融业,这对20多岁的爱尔兰兄弟是如何做到的? 2021-07-02
2020十大编程博客:私藏的宝藏编程语言博客大放送! 2021-07-02
编程中的角色选择:哪类工作角色最适合你? 2021-07-02
10种算法一文打尽!基本图表算法的视觉化阐释 2021-07-02
未来属于人工智能工程师,但成功转型不容易 2021-07-02
科技界“挠头”:困扰科技界可持续发展的难题 2021-07-02
20年后,这5种编码语言可能就消失了…… 2021-07-02
标准出现问题,人工智能正在走向错误的方向 2021-07-02
如何使用Python实现最低有效位隐写术? 2021-07-02
湮没在赞誉之中,科学史上鲜为人知的五大“败笔” 2021-07-02
别再对分类变量进行独热编码!你还有更好的选择 2021-07-02