python2.7字符编码:首先decode('utf-8)然后保存的时候又encode('utf-8)有没有必要?

查看:72
本文介绍了python2.7字符编码:首先decode('utf-8)然后保存的时候又encode('utf-8)有没有必要?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

问 题

想请教一下python2.7下字符编码的两个问题。

  1. python2.7爬虫爬取一个utf-8的中文网页,为了对防止乱码首先decode('utf-8')转化为unicode。然后如果将这些unicode编码的内容保存到文件的时候有调用encode('utf-8')以utf-8编码保存有没有必要?

# -*-coding:utf-8 -*-的作用是不是保存当前.py文件为utf-8编码?

解决方案

1.有必要

decode('utf-8')的作用是将utf8编码的字符串解码为unicode,而unicode是python最接受的字符串编码格式,不会因为各个工具库对字符编码处理不好而带来问题。

2.是的

coding:utf-8的作用是指定当前这个python代码文件里面所有字符串的编码

这篇关于python2.7字符编码:首先decode('utf-8)然后保存的时候又encode('utf-8)有没有必要?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆