一.安装pyspider
pip install pyspider
二.启动
pyspider all
三.安装中出现的问题处理
安装的时候出现如下的错误
"Please specify --curl-dir=/path/to/built/libcurl"
解决方法:下载安装pycurl,下载地址https://www.lfd.uci.edu/~gohlke/pythonlibs/#pycurl ,下载对应版本的whl文件,比如pycurl‑7.43.0.4‑cp38‑cp38‑win32.whl,然后安装下载文件,然后再安装就可以了 。
pip3 install pycurl‑7.43.0.4‑cp38‑cp38‑win32.whl
启动的时候出现如下错误
async=True, get_object=False, no_input=False):
解决方法:打开python安装目录下面的\Lib\site-packages\pyspider\run.py文件 ,查找所有的async将其替换为async1。
启动出现如下错误
def __init__(self, inqueue, outqueue, poolsize=100, proxy=None, async=True):
解决方法:打开python安装目录下面的\Lib\site-packages\pyspider\fetcher\tornado_fetcher.py文件,查找所有的async将其替换为async1。
webUI打不开
解决方法:打开python安装目录下面的\Lib\site-packages\pyspider\webui\app.py文件,查找所有的async将其替换为async1 。
启动出现如下错误:
- Deprecated option 'domaincontroller': use 'http_authenticator.domain_controller' instead
解决方法:打开python安装目录下面的\Lib\site-packages\pyspider\webui\webdav.py文件 ,查找 'domaincontroller': NeedAuthController(app),将其修改为
'http_authenticator':{ 'HTTPAuthenticator':NeedAuthController(app), },
启动出现如下错误:
ImportError: cannot import name 'DispatcherMiddleware' from 'werkzeug.wsgi' (D:\soft\python3.8\Lib\site-packages\werkzeug\wsgi.py)
解决方法:降低wsgidav的版本
# 卸载原版本pip uninstall wsgidav# 安装低版本的pip install werkzeug==0.16.1
启动出现如下错误:
pkg_resources.DistributionNotFound: The 'wsgidav>=2.0.0' distribution was not found and is required by pyspider
解决方法,安装 wsgidav
pip install wsgidav==2.0.0
四、安装Phantomjs
下载地址:http://npm.taobao.org/dist/phantomjs/
下载完成配置环境变量,将其下面的bin目录路径加入PATH环境变量里面。
文章来源于网络 ,如有侵权请联系站长QQ61910465删除
本文版权归趣营销www.SEOgUrublog.com 所有,如有转发请注明来出,竞价开户托管,seo优化请联系QQ卍61910465