文中的文本及图片来自互联网,仅作学习培训、沟通交流应用,不具备一切商业行为,著作权归创作者全部,如有什么问题请立即在线留言以作解决
( 要想学习培训Python?Python学习培训 0, 255, 1)">import requests # 第三方控制模块 import time # 時间控制模块 import pprint # 恢复出厂设置plc模块
四 、自然环境配备
python 3.6
pycharm
requests
五、寻找数据详细地址:
# 纪录程序执行的开始时间(时间格式) start_time = time.time() # 找数据详细地址 url = 'https://pvp..com/web201605/js/herolist.json'
六、推送互联网要求
# 推送互联网要求 response = requests.get(url=url) json_data = response.json() # pprint.pprint(json_data)
七 、详细编码:
# 数据获取 id(ename) 英雄名字(cname) 皮肤数量(skin_name) for data in json_data: cname = data['cname'] # 英雄名字 ename = data['ename'] # 英雄人物id(ename) try: skin_name = data['skin_name'].split('|') # 皮肤数量(skin_name) except: pass # print(cname, ename, skin_name) # 搭建皮肤数量的循环系统 """ http://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/106/106-bigskin-7.jpg http://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/ 英雄人物id '/' 英雄人物id -bigskin- 皮肤数量 '.jpg' """ for skin_num in range(1, len(skin_name) 1): skin_url = 'http://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/' str(ename) '/' str( ename) '-bigskin-' str(skin_num) '.jpg' # print(skin_url) # 要求每一个图片地址数据 skin_data = requests.get(skin_url).content # 照片数据的储存 英雄名字 皮肤姓名 文档尾缀 with open('pic\\' cname '-' skin_name[skin_num - 1] '.jpg', mode='wb') as f: f.write(skin_data) print('储存进行:', cname '-' skin_name[skin_num - 1]) all_time = time.time() - start_time print('共花费时间(企业秒): ', all_time)
末尾
网络爬虫是十分趣味的,因为它十分形象化 ,视觉冲击感重,写出去也很有满足感,网络爬虫尽管强劲 ,但干万不可以随便抓取隐私保护信息内容 。