python3中为什么urlparse.urljoin没有了

 我来答

2个回答

#热议# 不吃早饭真的会得胆结石吗？

武音1
2018-04-05 · TA获得超过2334个赞

知道小有建树答主

回答量：20

采纳率：0%

帮助的人：5209

我也去答题访问个人页

关注

展开全部

python3对urllib和urllib2进行了重构，拆分成了urllib.request, urllib.response, urllib.parse, urllib.error等几个子模块，这样的架构从逻辑和结构上说更加合理。

urljoin现在对应的函数是urllib.parse.urljoin

python3中的urlopen对于中文url是如何处理的？

urllib.request.urlopen('http://www.sina.com.cn'),如果url中有中文怎么办，Python3不是默认采用utf-8编码的吗？

刚刚看了urllib.parse.quote()的定义，完全可以直接处理中英混排的url，无需单独处理中文再拼接。具体方法：

# -*- coding:utf-8 -*-from urllib.parse import quoteurl = 'http://www.example.com/api.php?text=中文在这里'# 不带附加参数print('\n不带附加参数：\n%s' % quote(url))# 附带不转换字符参数print('\n附加不转换字符参数：\n%s' % quote(url, safe='/:?='))

运行结果：

不带附加参数：

http%3A//www.example.com/api.php%3Ftext%3D%E4%B8%AD%E6%96%87%E5%9C%A8%E8%BF%99%E9%87%8C

附加不转换字符参数：

http://www.example.com/api.php?text=%E4%B8%AD%E6%96%87%E5%9C%A8%E8%BF%99%E9%87%8C

quote可用的参数如下：

quote(string, safe='/', encoding=None, errors=None)

其中的safe参数可用的范围：

reserved = ";" | "/" | "?" | ":" | "@" | "&" | "=" | "+" | "$" | ","

这样对于爬取来的混合中文的url可以直接处理了。

已赞过 已踩过<

评论收起

liuweiathust
2016-03-29 · TA获得超过661个赞

知道小有建树答主

回答量：142

采纳率：100%

帮助的人：171万

我也去答题访问个人页

关注

展开全部

python3对urllib和urllib2进行了重构，拆分成了urllib.request, urllib.response, urllib.parse, urllib.error等几个子模块，这样的架构从逻辑和结构上说更加合理。

urljoin现在对应的函数是urllib.parse.urljoin

本回答被提问者和网友采纳

已赞过已踩过<

你对这个回答的评价是？
评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

资料下载标准版-资料文档库-全文阅读下载

资料下载专题资料下载，不用四处查资料，360文库海量精选资料下载全行业资料覆盖，千万文档即刻下载，享专属优惠!

wenku.so.com广告

python3中为什么urlparse.urljoin没有了

您可能关注的内容

其他类似问题

为你推荐：