【爬虫】练习
发布日期:2021-06-29 02:15:35
浏览次数:2
分类:技术文章
本文共 1081 字,大约阅读时间需要 3 分钟。
京东商品(正常运行)
import requestsurl='https://item.jd.com/100004286349.html'try: r=requests.get(url) r.raise_for_status()#状态码,返回200则对 r.encoding=r.apparent_encoding#编码 print(r.text[:1000])except: print('爬取失败')
亚马逊商品信息(存疑,可能是网站已变更?似乎无法得到有用信息)
import requestsurl='https://www.amazon.cn/gp/product/B01M8L5Z3Y'try: kv={'user-agent':'Mozilla/5.0'} #修改requestd库——伪装成浏览器,别被亚马逊识破 r=requests.get(url,headers=kv) r.raise_for_status()#状态码,返回200则对 r.encoding=r.apparent_encoding#编码 print(r.text[:1000])except: print('爬取失败')
百度、360搜索关键词,返回长度(百度存疑,可能是网站已变更——需要验证码;360可)
#百度import requestskeyword='python'#关键词try: kv={'wd':keyword} #修改requestd库——伪装成浏览器,别被亚马逊识破 r=requests.get('https://www.baidu.com/s',params=kv)#搜索关键词 print(r.request.url) r.raise_for_status() print(len(r.text))except: print('爬取失败')
#360import requestskeyword='python'try: kv={'q':keyword} #修改requestd库——伪装成浏览器,别被亚马逊识破 r=requests.get('https://www.so.com/s',params=kv)#搜索关键词 print(r.request.url) r.raise_for_status() print(len(r.text))except: print('爬取失败')
网络图片的爬取和存储
转载地址:https://blog.csdn.net/YWP_2016/article/details/105120724 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!
发表评论
最新留言
能坚持,总会有不一样的收获!
[***.219.124.196]2024年04月16日 13时04分09秒
关于作者
喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!
推荐文章
【毕业设计】自动泊车系统(APS)记录
2019-04-28
UVA 10100- Longest Match(dp之最长公共子序列)
2019-04-28
SDUT 3364-数据结构实验之图论八:欧拉回路(并查集)
2019-04-28
图的基础(C++)
2019-04-28
SAP用户增强总结-采购订单建立增加客户数据增强示例
2019-04-28
journal of neuroscience:面孔的神经表征与眼动模式相协调
2019-04-28
The Neuroscientist:运动性脑震荡的长期影响
2019-04-28
机器学习实战学习笔记一
2019-04-28
【vn.py】 策略实盘自动交易
2019-04-28
仿牛客社区项目2.5登录模块———登录退出功能
2019-04-28
LeetCode 190. 颠倒二进制位
2019-04-29
LeetCode 268. 丢失的数字
2019-04-29
LeetCode 231. 2 的幂
2019-04-29
[经典排序算法][集锦]
2019-04-29
无处不在的二分查找
2019-04-29
Java集合框架List,Map,Set等全面介绍
2019-04-29
Java 泛型(二) 泛型之中的通配符(Wildcards)使用
2019-04-29
7-36 复数四则运算 (15 分)
2019-04-29
基于powershell的渗透测试工具nishang
2019-04-29