序言

文中的文本及图片来自互联网,仅作学习培训、沟通交流应用,不具备一切商业行为,如有什么问题请立即在线留言以作解决。

 

很多人学习培训python,不清楚从何学习。
很多人学习培训python,把握了基础英语的语法之后 ,不清楚在哪儿找寻实例入门 。
许多 早已做实例的人,却不清楚如何去学习培训更为深奥的专业知识。
那麼对于这三类人,我给大伙儿出示一个好的在线学习平台 ,免费领教程视频,电子书,及其课程内容的源码!??¤
QQ群:961562169

有关自然环境配备

  • python 3.6
  • pycharm
  • requests
  • parsel

有关控制模块可pip安装 ,假如感觉安裝速率很慢点一下下边连接查询有关实例教程

PIP安裝控制模块不成功或是速度比较慢实例教程

要求网页页面

import requests url = 'http://sc.chinaz.com/yinxiao/' headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36' } response = requests.get(url=url, headers=headers) print(response.text)


可是回到数据信息有中文乱码,编号出現了难题,因此 我们只必须转换格式一下就可以了

response.encoding = response.apparent_encoding

分析数据信息

import parsel selector = parsel.Selector(response.text) urls = selector.css('#musiclist .n1::attr(thumb)').getall() titles = selector.css('#musiclist .z a::attr(alt)').getall() data = zip(urls, titles) for i in data: print(i)

储存数据信息

response_2 = requests.get(url=download_url, headers=headers) filename = '途径' title '.mp3' with open(filename, mode='wb') as f: f.write(response_2.content)


一页的影音文件就都储存到本地文件了

多张抓取影音文件编码

import requests import parsel for page in range(1, 603): url = 'http://sc.chinaz.com/yinxiao/index_{}.html'.format(page) headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36' } response = requests.get(url=url, headers=headers) response.encoding = response.apparent_encoding selector = parsel.Selector(response.text) urls = selector.css('#musiclist .n1::attr(thumb)').getall() titles = selector.css('#musiclist .z a::attr(alt)').getall() data = zip(urls, titles) for i in data: print(i) download_url = i[0] title = i[1] response_2 = requests.get(url=download_url, headers=headers) filename = '途径' title '.mp3' with open(filename, mode='wb') as f: f.write(response_2.content)


每张40个文档 ,一共是602页数据信息,一共大约是2W好几个影音文件素材图片,这里我们就不等了就安装了一千多个文档 ,关键免费下载多了也占硬盘内存~ 编码還是有很多能够提升的地区~

文章来源于网络 ,如有侵权请联系站长QQ61910465删除
本文版权归趣快排www.sEoguruBlog.com 所有,如有转发请注明来出,竞价开户托管,seo优化请联系QQ✈61910465