菜鸡源码,专注精品下载!
当前位置:首页 > 建站教程 > 建站知识

分享一个用于获取必应壁纸的Python爬虫

发布时间:2024-01-05  栏目:建站知识   浏览:   分类:python教程 python爬虫 必应 必应壁纸

必应壁纸Python爬虫是一种用于从必应网站获取壁纸图片的爬虫程序。它可以通过分析网页源代码,找到图片的URL,并将其下载到本地。这个爬虫程序可以使用Python编写,利用requests库和BeautifulSoup库来实现。首先,我们需要安装这两个库,然后编写代码来获取网页源代码,解析出图片URL,并使用requests库下载图片。最后,我们可以将下载的图片保存到本地文件夹中。这样,我们就可以轻松地获取必应网站上的壁纸图片了。

importrequestsimportreimportos#模拟浏览器请求headers={"User-Agent":"Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/96.0.4664.110Safari/537.36"}#getWpListjson部分参数#data={#"pageNum":1,#"pageSize":9#}#循环3次,即从首页到第三页#"pageNum"页码;pageSize,最多9张图。foriinrange(4):data={"pageNum":i,"pageSize":9}#请求图片网站API,调用json参数request=requests.post('http://www.isummer.cn/x_site/wp/getWpList',json=data,headers=headers)#拼接用户主目录下的Pictures文件夹路径default_pictures_dir=os.path.join(os.path.expanduser("~"),"Pictures")#拼接成指定保存的图片目录picture_path=os.path.join(default_pictures_dir,"bing")#如果目录不存在则创建ifnotos.path.exists(picture_path):os.makedirs(picture_path)#测试现象#/th?id=OHR.Popocatepetl_ZH-CN5483138337_1920x1080.jpg&rf=LaDigue_1920x1080.jpg&pid=hp#循环获取返回的图片地址foriinrequest.json()["data"]["list"]:#"wpUrl"字符串中提取出第一个以&符号为分隔符的第一个字符串picture_list=i["wpUrl"].split("&")[0]#print(picture_list)返回结果:/th?id=OHR.SouthPadre_ZH-CN8788572569_1920x1080.jpg#采取策略:先分割后拼接#picture_name=picture_list.split(".")#返回结果:['/th?id=OHR','SouthPadre_ZH-CN8788572569_1920x1080','jpg']picture_name=re.split("[._]",picture_list)#拼接图片保存路径save_path=os.path.join(picture_path,f"{picture_name[1]}.{picture_name[4]}")#请求图片的下载地址request=requests.post(f'https://cn.bing.com{picture_list}')#保存图片到本地withopen(save_path,"wb")asf:f.write(request.content)print("下载完成:"+save_path)


评论
建站知识
建站知识
使用技巧
调试安装
运营推广