Python3url解码与参数解析-创新互联

在获取zk节点时,有些子节点名字直接就是编码后的url,就像下面这行一样:

创新互联建站基于分布式IDC数据中心构建的平台为众多户提供德阳电信服务器托管 四川大带宽租用 成都机柜租用 成都服务器租用。
url='dubbo%3A%2F%2F10.4.5.3%3A20880%2Fcom.welab.authority.service.AuthorityService%3Fanyhost%3Dtrue%26application%3Dwelab-authority%26dubbo%3D2.5.7'

先需要把这个url里进行解码, 转成如下这种:

dubbo://10.4.5.3:20880/com.welab.authority.service.AuthorityService?anyhost=true&application=welab-authority&dubbo=2.5.7

然后有用的参数: url中的ip地址, 参数中application对应的值

Python2解码与提取参数

>>> import urlparse
>>> urldata = urlparse.unquote(url)
>>> print urldata
dubbo://10.4.5.3:20880/com.welab.authority.service.AuthorityService?anyhost=true&application=welab-authority&dubbo=2.5.7

#转成一个格式化对象
>>> result = urlparse.urlparse(urldata)
>>> print result
ParseResult(scheme='dubbo', netloc='10.4.5.3:20880', path='/com.welab.authority.service.AuthorityService', params='', query='anyhost=true&application=welab-authority&dubbo=2.5.7', fragment='')

#提取url中的参数,即url中?后的内容
>>> args = urlparse.parse_qs(result.query)          
>>> print args
{'application': ['welab-authority'], 'anyhost': ['true'], 'dubbo': ['2.5.7']}

#获取我想要的信息  
>>> ip= result.netloc
>>> application = args.get('application',[])
>>> print ip
10.4.5.3:20880  
>>> print application
['welab-authority']

Python3 解码与提取参数

上面的测试中详细打印了输出信息, 这次就直接写在py脚本里了。

from urllib import parse

#url解码
urldata = parse.unquote(urldata)

#url结果  
result = parse.urlparse(urldata)

#url里的查询参数  
query_dict = parse.parse_qs(result.query)

#获取我需要的信息
ip = result.netloc  
application = query_dict.get('application',[])

另外有需要云服务器可以了解下创新互联scvps.cn,海内外云服务器15元起步,三天无理由+7*72小时售后在线,公司持有idc许可证,提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案,具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势,专为企业上云打造定制,能够满足用户丰富、多元化的应用场景需求。


分享名称:Python3url解码与参数解析-创新互联
网站路径:http://scyanting.com/article/geoog.html