如何避免Puppeteer被前端JS检测

栏目: Node.js · 发布时间: 4年前

内容简介:这两天开始看puppeteer,发现居然也能被前端js检测出来!?github的issue区找了找,原来puppeteer启动的chrome里面,是有navigator.webdriver属性的,搞什么搞么,老外真是做那啥还要立牌坊Orzissue里也看到了解决方案:

这两天开始看puppeteer,发现居然也能被前端js检测出来!?

github的issue区找了找,原来puppeteer启动的chrome里面,是有navigator.webdriver属性的,搞什么搞么,老外真是做那啥还要立牌坊Orz

issue里也看到了解决方案:

await this.page.evaluateOnNewDocument(() => {
         Object.defineProperty(navigator, 'webdriver', {
         get: () => undefined,
    });
 }

但是说实话这个还是有点问题的,因为用 "webdriver" in navigator 还是能检测出来。

想找找到底哪个环节把"webdriver"属性加上的,但是文本搜索发现puppeteer源码中并没有……

后来发现是启动chrome的默认参数列表中有"--enable-automation"……

找了一下这个命令行参数的说明:

--enable-automation: Inform users that their browser is being controlled by an automated test.

妈蛋纯粹是立牌坊用的,其它毛用没有……

确认了就可以干掉它了,启动chrome时加个忽略默认参数即可:

const browser = await puppeteer.launch({ignoreDefaultArgs: ["--enable-automation"]});

以上所述就是小编给大家介绍的《如何避免Puppeteer被前端JS检测》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

编码

编码

[美] Charles Petzold / 左飞、薛佟佟 / 电子工业出版社 / 2010 / 55.00元

本书讲述的是计算机工作原理。作者用丰富的想象和清晰的笔墨将看似繁杂的理论阐述得通俗易懂,你丝毫不会感到枯燥和生硬。更重要的是,你会因此而获得对计算机工作原理较深刻的理解。这种理解不是抽象层面上的,而是具有一定深度的。一起来看看 《编码》 这本书的介绍吧!

JSON 在线解析
JSON 在线解析

在线 JSON 格式化工具

URL 编码/解码
URL 编码/解码

URL 编码/解码

Markdown 在线编辑器
Markdown 在线编辑器

Markdown 在线编辑器