博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Python URL中文的编解码
阅读量:5776 次
发布时间:2019-06-18

本文共 557 字,大约阅读时间需要 1 分钟。

hot3.png

 

不同的网站采用的编解码不同,在获取连接后的用于看得和用于爬取的URL是连接是不同的。

import urllib2uni_str = u'\u559c\u9152DVD.rmvb'uni_url = u'http://thunder.ffdy.cc/EBDA034628B5E6B16C1E79251BF0B25B06CF2C13/\u559c\u9152DVD.rmvb'#编码, 用于发送请求actual_url = uni_url[0:7] + urllib2.quote( uni_url[7:].encode('gbk') )#actual_url = u'http://thunder.ffdy.cc/EBDA034628B5E6B16C1E79251BF0B25B06CF2C13/%CF%B2%BE%C6DVD.rmvb'#解码,查看URLurllib2.unquote(str(actual_url)).decode("gbk")u'http://thunder.ffdy.cc/EBDA034628B5E6B16C1E79251BF0B25B06CF2C13/\u559c\u9152DVD.rmvb'

转载于:https://my.oschina.net/cppblog/blog/38926

你可能感兴趣的文章
jQuery|元素遍历
查看>>
FreeNAS8 ISCSI target & initiator for linux/windows
查看>>
Rainbond 5.0.4版本发布-做最好用的云应用操作系统
查看>>
Java判断是否为垃圾_Java GC如何判断对象是否为垃圾
查看>>
多项式前k项和java_多项式朴素贝叶斯softmax改变
查看>>
OracleLinux安装说明
查看>>
标准与扩展ACL 、 命名ACL 、 总结和答疑
查看>>
使用@media实现IE hack的方法
查看>>
oracle体系结构
查看>>
【SDN】Openflow协议中对LLDP算法的理解--如何判断非OF区域的存在
查看>>
使用CocoaPods过程中的几个问题
查看>>
Pinpoint跨节点统计失败
查看>>
机房带宽暴涨问题分析及解决方法
查看>>
XP 安装ORACLE
查看>>
八、 vSphere 6.7 U1(八):分布式交换机配置(vMotion迁移网段)
查看>>
php5编译安装常见错误和解决办法集锦
查看>>
ORACLE配置,修改tnsnames.ora文件实例
查看>>
Workstation服务无法启动导致无法访问文件服务器
查看>>
Linux常用命令(一)
查看>>
我的友情链接
查看>>