内容简介:Scrapy 是一套基于 Twisted 的异步处理框架,纯 Python 实现的爬虫框架,用户只需要定制开发几个模块就可以轻松的实现一个爬虫,用来抓取网页内容以及各种图片。它也可以用于广泛的目的,从数据挖掘、监控到自动测...
Scrapy 是一套基于 Twisted 的异步处理框架,纯 Python 实现的爬虫框架,用户只需要定制开发几个模块就可以轻松的实现一个爬虫,用来抓取网页内容以及各种图片。它也可以用于广泛的目的,从数据挖掘、监控到自动测试等。
Scrapy 2.5.0 正式发布,本次更新内容如下:
- 官方 Python 3.9 支持;
- 实验性的 HTTP/2 支持;
- 新增 get_retry_request() 函数,用于重试来自 spider 回调的请求;
- 新的 headers_received 信号允许提前停止下载;
- 新的 Response.protocol 属性;
更多详情可查看:https://github.com/scrapy/scrapy/releases/tag/2.5.0
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。