序言

文中的文本及图片来自互联网,仅作学习培训 、沟通交流应用,不具备一切商业行为,如有什么问题请立即在线留言以作解决 。

 

很多人学习培训python ,不清楚从何学习。
很多人学习培训python,把握了基础英语的语法之后,不清楚在哪儿找寻实例入门。
许多 早已做实例的人 ,却不清楚如何去学习培训更为深奥的专业知识 。
那麼对于这三类人,我给大伙儿出示一个好的在线学习平台,免费领教程视频 ,电子书,及其课程内容的源码!??¤
QQ群:961562169

有关自然环境配备

  • python 3.6
  • pycharm
  • requests
  • parsel

有关控制模块可pip安装,假如感觉安裝速率很慢点一下下边连接查询有关实例教程

PIP安裝控制模块不成功或是速度比较慢实例教程

要求网页页面

import requests url = 'http://sc.chinaz.com/yinxiao/' headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36' } response = requests.get(url=url, headers=headers) print(response.text)


可是回到数据信息有中文乱码 ,编号出現了难题 ,因此 我们只必须转换格式一下就可以了

response.encoding = response.apparent_encoding

分析数据信息

import parsel selector = parsel.Selector(response.text) urls = selector.css('#musiclist .n1::attr(thumb)').getall() titles = selector.css('#musiclist .z a::attr(alt)').getall() data = zip(urls, titles) for i in data: print(i)

储存数据信息

response_2 = requests.get(url=download_url, headers=headers) filename = '途径' title '.mp3' with open(filename, mode='wb') as f: f.write(response_2.content)


一页的影音文件就都储存到本地文件了

多张抓取影音文件编码

import requests import parsel for page in range(1, 603): url = 'http://sc.chinaz.com/yinxiao/index_{}.html'.format(page) headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36' } response = requests.get(url=url, headers=headers) response.encoding = response.apparent_encoding selector = parsel.Selector(response.text) urls = selector.css('#musiclist .n1::attr(thumb)').getall() titles = selector.css('#musiclist .z a::attr(alt)').getall() data = zip(urls, titles) for i in data: print(i) download_url = i[0] title = i[1] response_2 = requests.get(url=download_url, headers=headers) filename = '途径' title '.mp3' with open(filename, mode='wb') as f: f.write(response_2.content)


每张40个文档,一共是602页数据信息,一共大约是2W好几个影音文件素材图片 ,这里我们就不等了就安装了一千多个文档,关键免费下载多了也占硬盘内存~ 编码還是有很多能够提升的地区~

文章来源于网络,如有侵权请联系站长QQ61910465删除
本文版权归QU快排Www.seoGurubLog.com 所有,如有转发请注明来出,竞价开户托管,seo优化请联系QQ▲61910465