Java爬虫实战第一篇:微博爬虫
发布日期:2021-06-29 19:25:53
浏览次数:4
分类:技术文章
本文共 535 字,大约阅读时间需要 1 分钟。
核心:1、有大量的微博uid 2、处理微博的反爬虫
一、开始准备工作
1、获取访问微博网页的cookie
谷歌浏览器访问:https://m.weibo.cn/按F12进入调试模式复制如图所示的数据,这就是我们需要的cookie了
2、cookie拿到了,接下来就是写代码模仿浏览器访问内容了
/** * 基于HttpClient 4.3的通用Get方法--微博Cookie * @param url 提交的URL * @return 提交响应 */ public static String get_byCookie(String url,String cookie) { if(CheckUtil.checkNull(cookie)){ cookie = "SCF=AjGxj6fuG*****00174";//这里就是刚刚你获取的cookie,有很长 } CloseableHttpClient client = HttpClients.createDefault(); String responseText = ""; Clos
转载地址:https://dada-superman.blog.csdn.net/article/details/91570539 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!
发表评论
最新留言
逛到本站,mark一下
[***.202.152.39]2024年04月23日 18时13分15秒
关于作者
喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!
推荐文章
在Android Studio中进行单元测试和UI测试
2019-04-30
qt-embedded-linux移植要点qt
2019-04-30
Linux设备文件简介
2019-04-30
java单例模式
2019-04-30
移植了Qt4.5
2019-04-30
DM3730触摸屏校验
2019-04-30
在子线程中new Handler报错--Can't create handler inside thread that has not called Looper.prepare()
2019-04-30
移植Qt4.7.3
2019-04-30
Qt移植对USB鼠标键盘、触摸屏的支持
2019-04-30
LCD驱动移植
2019-04-30
驱动开发小结
2019-04-30
Qt Creator创建纯C、c++工程
2019-04-30
Android单元测试之 Robolectric3.0+
2019-04-30
qt configure参数解释
2019-04-30
Git Push 避免用户名和密码方法
2019-04-30
Java总结篇系列:Java多线程(一)
2019-04-30
产品设计开发要领
2019-04-30
Android线程操作类(暂停、重新开启、停止)
2019-04-30
android - JNI - 一维数组、二维数组的访问与使用
2019-04-30
在 Android Studio 2.2 中愉快地使用 C/C++
2019-04-30