python3.x以上 爬虫 使用问题 urllib(不能使用urllib2)

栏目: IT技术 · 发布时间: 4年前

内容简介:python3.x以上 爬虫 使用问题 urllib(不能使用urllib2)

问题一: python 3.x 以上版本揽括了 urllib2,把urllib2 和 urllib 整合到一起。

 并且引入模块变成一个,只有 import urllib

# import urllib
# import urllb2

#正确使用

import urllib

  

  所以不能使用 urllib2.urlopen()方法,否则会报错无此模块。

NameError: name 'urllib2' is not defined

  

 3.x以上版本 # urllib2.open  不能使用,用urllib.request 模块 代替urllib2

1 import urllib.request
2 
3 response = urllib.request.urlopen('http://www.baidu.com')

问题二: 变量名不能与引入模块名方法相同,否则会引起错误

  

 1 import urllib.request
 2 
 3 #错误写法
 4 
 5 request = urllib.request.urlopen('http://www.baidu.com')
 6 
 7 #否则 TypeError: 'module' object is not callable
 8 
 9 #正确写法
10 
11 rqs = urllib.request.urlopen('http://www.baidu.com')

问题四 print 输出问题

  3.x  版本 print 已经成为一个方法, 输出任何东西都要需要被 ()括号 包括,不然会出现问题

第一步初步 方法 爬去百度首页

1 import urllib.request
2 
3 rqs = urllib.request.urlopen('http://www.baidu.com')
4 
5 html = rqs.read()
6 
7 print(html)

以上所述就是小编给大家介绍的《python3.x以上 爬虫 使用问题 urllib(不能使用urllib2)》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

标签: python

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

做自己:鬼脚七自媒体第一季

做自己:鬼脚七自媒体第一季

鬼脚七 / 电子工业出版社 / 2013-7 / 77.00元

当我们习惯了在社会上带着面具的时候,真实成为了一件奢侈的事情。 做到足够真实,让自己的本性表达出来,这需要勇敢。本书是鬼脚七自媒体的原创文集,主题就是做自己。本书有关于生活、互联网、自媒体的睿智分享,也有关于淘宝、搜索的独到见解,是一本接地气,文艺范,并充满正能量的电商生活书。 本书最适合淘宝卖家、电子商务人群、希望了解电商和互联网的人群阅读,也推荐热爱生活的70、80、90后阅读。一起来看看 《做自己:鬼脚七自媒体第一季》 这本书的介绍吧!

SHA 加密
SHA 加密

SHA 加密工具

Markdown 在线编辑器
Markdown 在线编辑器

Markdown 在线编辑器

RGB HSV 转换
RGB HSV 转换

RGB HSV 互转工具