从零开始，学会Python爬虫不再难！！！ -- （3）揭秘：我是如何绕过登录验证的丨蓄力计划-白红宇的个人博客

发布日期：2021-06-30 19:48:03 浏览次数：2 分类：技术文章

本文共 543 字，大约阅读时间需要 1 分钟。

登录验证的背后

打开一个网页，发现它需要登录，有可能还有各种各样的验证码。

输入账号密码，或者扫码之后登录上网页，解锁更多新功能。

只要我们不关闭网页，这个登录状态就会被保持着。

这个场景都不陌生吧。

我们关闭浏览器，再次打开浏览器，会发现有的网页依旧保持着登录状态，比如说CSDN，而有的网页已经被退出登录了，想再次进入就需要重新登录，这样的网页太多了。

是什么样的机制在支撑着这一切的运转呢？

站在网站的角度，我们要讲一下前端和后端，session和cookie。

web客户端请求Tomcat服务端，属于HTTP请求（不是TCP，也不是UDP，注意区分）。

http请求是无状态的，即每次请求服务端，都是一个全新的请求，服务端根本不知道我是谁。所以当我从客户端发起一次登录请求并登录成功之后，再进行其他的请求，因为服务端无法识别我是我，所以它会叫我再登录，所以我绝对会举报这家网站的，耶稣也拦不住，我说的！！！

为了证明我是我，也为了这些网站还能够开的下去，它们准备为我在这个客户端上的所有请求（或者一类请求），专门给我开一个房间（如果是一类请求开一个房间，那对于我在这个客户端上的所有请求就会开多个房间），然后把钥匙给我，或者给我一串儿钥匙。

机会

转载地址：https://lion-wu.blog.csdn.net/article/details/115654127 如侵犯您的版权，请留言回复原文章的地址，我们会给您删除此文章，给您带来不便请您谅解！

上一篇：爬虫百战穿山甲（2）：百度翻译爬虫

下一篇：爬虫百战穿山甲（1）有道翻译爬虫

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！

-- 愿君每日到此一游！