EasySelect 1.1.0 发布,能够快速构建爬虫的浏览器插件

栏目: 软件资讯 · 发布时间: 2天前

来源: 开源中国社区

内容简介:一个Chrome/Firefox扩展,让你根据页面元素快速获取可读可维护的 CSS 选择器。 为什么不用浏览器自带的 "Copy selector"? 举例来说,这是浏览器自动生成的: #TopstoryContent > div > div > div > div:nth-chi...

本文转载自:https://www.oschina.net/news/116824/easyselect-1-1-0-released,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有。

一个Chrome/Firefox扩展,让你根据页面元素快速获取可读可维护的 CSS 选择器。

为什么不用浏览器自带的 "Copy selector"?

举例来说,这是浏览器自动生成的:

#TopstoryContent > div > div > div > div:nth-child(41) > div > div > h2 > div > a

这是EasySelect拿到的:

div[itemprop='zhihu:question'] > a

安装

Chrome扩展商店

Firefox附加组件

或从release手动安装

使用

首先,在浏览器中使用检查元素呼出调试工具,然后用inspector选择一个元素。

在右侧的面板选择一下“Easy Select”就能看到 工具 界面了。

界面分三个部分:

1. 层级选择面板

CSS选择器通常通过上级元素来进行辅助定位,例如:

div.items > article > a.title

最高是到 html 元素这一级,如果你不小心点多了,生成出的表达式会很长,可以使用第二排限制最终表达式的长度。

2. 元素选择面板

这个就是通过选择class还有元素属性构造选择器了。这个面板与层级选择面板是联动关系。

3. 结论面板

这里可以看到最终生成的表达式,当前页面的表达式匹配元素数量。

还可以进行高亮,以及最下面的表达式 / 语句复制。

开发

npm install # 安装环境
npm run serve # 编译并热更新
npm run build # 生产环境打包
npm run analyze # 分析包组件大小

更新内容:

  • i18n 支持 (vue-i18n)

  • 优化了 id 属性CSS选择器的生成

  • 修正了导出的 python css lxml 语句不正确的问题

  • 支持了属性中带换行符的元素

  • 高亮时带上背景色

  • 层级选择面板:缩小了按钮

  • 层级选择和元素选择面板:增加滚动条

  • 结论面板:css / xpath 切换选项卡


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

关注码农网公众号

关注我们,获取更多IT资讯^_^


为你推荐:

相关软件推荐:

查看所有标签

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

Python 3网络爬虫开发实战

Python 3网络爬虫开发实战

崔庆才 / 人民邮电出版社 / 2018-4 / 99

本书介绍了如何利用Python 3开发网络爬虫,书中首先介绍了环境配置和基础知识,然后讨论了urllib、requests、正则表达式、Beautiful Soup、XPath、pyquery、数据存储、Ajax数据爬取等内容,接着通过多个案例介绍了不同场景下如何实现数据爬取,后介绍了pyspider框架、Scrapy框架和分布式爬虫。 本书适合Python程序员阅读。一起来看看 《Python 3网络爬虫开发实战》 这本书的介绍吧!

XML、JSON 在线转换
XML、JSON 在线转换

在线XML、JSON转换工具

XML 在线格式化
XML 在线格式化

在线 XML 格式化压缩工具

RGB CMYK 转换工具
RGB CMYK 转换工具

RGB CMYK 互转工具