python3.x以上爬虫使用问题 urllib（不能使用urllib2）

栏目: IT技术 · 发布时间: 6年前

内容简介：python3.x以上爬虫使用问题 urllib（不能使用urllib2）

问题一： python 3.x 以上版本揽括了 urllib2，把urllib2 和 urllib 整合到一起。

并且引入模块变成一个，只有 import urllib

# import urllib
# import urllb2

#正确使用

import urllib

　　所以不能使用 urllib2.urlopen()方法，否则会报错无此模块。

NameError: name 'urllib2' is not defined

　3.x以上版本　# urllib2.open 不能使用，用urllib.request 模块代替urllib2

1 import urllib.request
2 
3 response = urllib.request.urlopen('http://www.baidu.com')

问题二：变量名不能与引入模块名方法相同，否则会引起错误

 1 import urllib.request
 2 
 3 #错误写法
 4 
 5 request = urllib.request.urlopen('http://www.baidu.com')
 6 
 7 #否则 TypeError: 'module' object is not callable
 8 
 9 #正确写法
10 
11 rqs = urllib.request.urlopen('http://www.baidu.com')

问题四 print 输出问题

　　3.x 版本 print 已经成为一个方法，输出任何东西都要需要被（）括号包括，不然会出现问题

第一步初步方法爬去百度首页

1 import urllib.request
2 
3 rqs = urllib.request.urlopen('http://www.baidu.com')
4 
5 html = rqs.read()
6 
7 print(html)

以上所述就是小编给大家介绍的《python3.x以上爬虫使用问题 urllib（不能使用urllib2）》，希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对码农网的支持！

标签： python

猜你喜欢:

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

未来世界的幸存者

阮一峰 / 人民邮电出版社 / 2018-6-1 / 39.00 元

本书为阮一峰博客文集，主要收录的是作者对技术变革的影响的一些思考，希望能够藉此书让读者意识到世界正在剧烈变化，洪水就在不远处，从而早早准备出路。本书适合所有乐于思考的读者。一起来看看《未来世界的幸存者》这本书的介绍吧!

码农工具

python3.x以上爬虫使用问题 urllib（不能使用urllib2）

未来世界的幸存者

图片转BASE64编码

正则表达式在线测试

HSV CMYK 转换工具

python3.x以上 爬虫 使用问题 urllib（不能使用urllib2）

未来世界的幸存者

图片转BASE64编码

正则表达式在线测试

HSV CMYK 转换工具

python3.x以上爬虫使用问题 urllib（不能使用urllib2）