python爬取百度页面的热搜榜,爬取百度这类大网页页面你还不来看看

2020-12-21 21:31:03LanceLee数据爬虫329

- N +

文中的文本及图片来自互联网,仅作学习培训、沟通交流应用,不具备一切商业行为,著作权归创作者全部,如有什么问题请立即在线留言以作解决

本产品文章内容来源于腾讯云服务创作者：孤单的明月

內容概述
python3简易抓取百度搜索引擎的首页的热搜榜信息内容

抓取的网页页面以下：

编码以下：

# -*- coding: utf-8 -*-

import requests
from bs4 import BeautifulSoup
from datetime import datetime

headers = {
    'User-Agent': "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.132 Safari/537.36 "
}
response = requests.get("https://www.baidu.com/", headers=headers)
# 分析
bsObj = BeautifulSoup(response.text)
# 获得 response header時间
resDate = response.headers.get('Date')
print(resDate)
# 寻找热搜榜
nameList = bsObj.findAll("li", {"class": {"hotsearch-item odd", "hotsearch-item even"}})
# 加上热搜榜的內容
tests = []
for name in nameList:
    tests.append(name.getText())
# 排列
tests.sort()
for news in tests:
    news = news[0:1]   " : "   news[1:]
    print(news)

复印出的結果以下：

文章来源于网络，如有侵权请联系站长QQ61910465删除

本文版权归去快排wWw.seogUrublog.com 所有,如有转发请注明来出,竞价开户托管,seo优化请联系qq❉61910465