splash 实现类似selenium的WebDriverWait

栏目: Lua · 发布时间: 7年前

内容简介:在用splash写爬虫的时候发现没有类似以freebuf为例。使用默认lua代码时经常碰到页面没有加载完全就返回源码的情况。参考了下官方文档。在lua代码中实现类似的功能。

在用splash写爬虫的时候发现没有类似 selenium的WebDriverWait 的功能。

以freebuf为例。使用默认 lua 代码时经常碰到页面没有加载完全就返回源码的情况。

参考了下官方文档。在lua代码中实现类似的功能。

在lua代码中,我们可以用 splash:select 函数来获取html的元素,因此可以通过监测某个元素是否存在来判断网页是否加载完成。当然也可以使用 splash:wait 来等待多少秒后返回源码到scrapy。

function main(splash)
    splash.images_enabled = false
    assert(splash:go(splash.args.url))
    assert(splash:wait(1))

    local el = splash:select('.icon-login')

    while not  el do
      assert(splash:wait(2))
      el = splash:select('.icon-login')
      if el then
          break
      end
    end
    assert(splash:wait(2))
    return  {splash:html(),splash:png()}
end

splash 实现类似selenium的WebDriverWait


以上所述就是小编给大家介绍的《splash 实现类似selenium的WebDriverWait》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

思考,快与慢

思考,快与慢

[美] 丹尼尔·卡尼曼 / 胡晓姣、李爱民、何梦莹 / 中信出版社 / 2012-7 / 69.00元

《纽约时报》2011年度十大好书 新书上市,连续20多周蝉联亚马逊、《纽约时报》畅销书排行榜前20名,上市至今超过7个月,横扫全球各大畅销书排行榜,稳居亚马逊总榜前50名 《经济学人》、《华尔街日报》、《卫报》、《纽约时报》、《金融时报》、《商业周刊》、《华盛顿邮报》、等国外权威媒体,《三联生活周刊》、《商学院》、《东方早报》等国内知名媒体争相报道,国内外读者好评如潮 人类究竟有......一起来看看 《思考,快与慢》 这本书的介绍吧!

RGB转16进制工具
RGB转16进制工具

RGB HEX 互转工具

随机密码生成器
随机密码生成器

多种字符组合密码

XML 在线格式化
XML 在线格式化

在线 XML 格式化压缩工具