内容简介:本人业余写python爬虫、python小工具已有两年有余了,在这里推荐一些学习时觉得比较好的视频教程、文章教程等,纯属个人建议,不喜勿喷自学最好的还是动手操作,想用什么找什么,语法文章推荐Python3菜鸟教程 视频教学中国大学MOOC,个人比较偏好嵩天老师的课程,有很多课程涉及到了Python语言程序设计、Python网络爬虫与信息提取、Python数据分析与展示、Python科学计算三维可视化等,可以说很全嵩天老师所有课程 ,其次视频推荐莫烦Python,里面有文章介绍和视频介绍,别人偏向与文章介绍,
本人业余写 python 爬虫、python小 工具 已有两年有余了,在这里推荐一些学习时觉得比较好的视频教程、文章教程等,纯属个人建议,不喜勿喷
目录
资料篇
自学最好的还是动手操作,想用什么找什么,语法文章推荐Python3菜鸟教程 视频教学中国大学MOOC,个人比较偏好嵩天老师的课程,有很多课程涉及到了Python语言程序设计、Python网络爬虫与信息提取、Python数据分析与展示、Python科学计算三维可视化等,可以说很全嵩天老师所有课程 ,其次视频推荐莫烦Python,里面有文章介绍和视频介绍,别人偏向与文章介绍,这样更快更节省时间
爬虫篇
介绍一下爬虫涉及到的第三方库及其相关文档
- urllib3
- urllib3文档
- Requests文档
- Beautiful Soup英文版
- Beautiful Soup中文版
- 正则表达式
- scrapy
- scrapy文档
- PyMySQL
- PyMySQL文档
数据分析篇
数据分析的第三方库介绍
附上github上python不同用途的第三方库的总价 awesome-python
css选择器语法
表达式 说明 * 选择所有节点 #container 选择id为container的节点 .container 选取所有class包含container的节点 li a 选取所有li下的所有a节点 ul + p 选择ul后面的第一个p元素 div#container > ul 选取id为container的div的第一个ul子元素 ul ~ p 选取与ul相邻的所有p元素 a[title] 选取所有有title属性的a元素 a[href="http://baidu.com"] 选取所有href属性为http://baidu.com值的a元素 a[href*="baidu"] 选取所有href属性包含baidu的a元素 a[href^="http"] 选取所有href属性值以http开头的a元素 a[href$=".jpg"] 选取所有href属性值以.jpg结尾的a元素 input[type=radio]:checked 选择选中的radio的元素 div:not(#container) 选取所有id非container的div属性 li:nth-child(3) 选取第三个li元素 tr:nth-child(2n) 第偶数个tr [css视频介绍](http://www.w3school.com.cn/css/css_selector_type.asp) 复制代码
re正则表达式语法
字符 匹配 . 任意字符(除了\n) [...] 字符集 \d/\D 数字/非数字 \s/\S 空白/非空白 \w/\W 单词字符[a-zA-Z0-9]/非单词字符 * 前一个字符0次或者无限次 + 前一个字符1次或者无限次 ? 前一个字符0次或者一次 {m}/{m,n} 前一个字符m次或者n次 *?/+?/?? 非贪婪(尽可能少匹配字符) ^ 字符串开头 $ 字符串结尾 \A/\Z 指定的字符串必须出现在开头/结尾 | 匹配左右任意一个表达式 (ab) 括号中表达式作为一个分组 \<number> 引用编号为num的分组匹配到的字符串 (?P<name>) 分组起一个别名 (?P=name) 引用别名为name的分组匹配字符串 [\u4E00-\u9FA5] 一个汉字 复制代码
xpath语法
表达式 说明 article 选取所有article元素的所有子节点 /article 选取跟元素article article/a 选取所有属于article的子元素的a元素 //div 选取所有div子元素(不论出现在文档任何地方) article//div 选取所有输入article元素的后代的div元素,不管它出现在article之下的任何位置 //@class 选取所有名为class的属性 /article/div[1] 选取属于article子元素的第一个div元素 /article/div[last()] 选取输入article子元素的最后一个div元素 /article/div[last()-1] 选取属于article子元素的倒数第二个div元素 //div[@lang] 选取所有拥有lang属性的div元素 //div[@lang='eng] 选取所有lang属性为eng的div元素 /div/* 选取属于div元素的所有子节点 //* 选取所有元素 //div[@*] 选取所有带属性的title元素 //div/a|//div/p 选取所有div元素的a和p元素 //span|//ul 选取文档中的span和ul元素 article/div/p|//span 选取所有属于article元素的div元素的p元素以及文档中所有的span元素 复制代码
以上所述就是小编给大家介绍的《Python 学习资料推荐》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!
猜你喜欢:- 机器学习、Python和数学学习资料汇总
- Flutter 学习资料
- 架构师学习资料分享
- Python Web 学习资料总结
- Flutter 学习资料及笔记总结
- 一文读懂自学机器学习的误区和陷阱(附学习资料)
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Head First HTML5 Programming
Eric Freeman、Elisabeth Robson / O'Reilly Media / 2011-10-18 / USD 49.99
What can HTML5 do for you? If you're a web developer looking to use this new version of HTML, you might be wondering how much has really changed. Head First HTML5 Programming introduces the key featur......一起来看看 《Head First HTML5 Programming》 这本书的介绍吧!