【python】将gbk编码的文件转为Unicode编码

前言

编码一直是程序员困扰的问题,如何使用python将gbk编码的文件转为utf8编码?其实也不难,主要使用python中的一个包(自带):codecs。相对于其他编程语言来说,这个是相当便捷的,当然你也可以使用记事板,notepad++手动修改编码。废话不多说,下面就是代码实现

环境准备

系统:win10

python版本:3.6

所需安装工具包:codecs

程序实现

import os
import codecs
import sys


def main(file1, file2 ):
    """将gbk编码的文件转为utf8编码的文件
    :param file1: gbk编码的文件
    :param file2: utf8编码的文件
    :return:
    """
    # 读取原文
    with open(file1, "r", encoding="gbk") as f:
        results = f.readlines()
    # 开始遍历读取结果,并写到新的文件中
    with codecs.open(file2, "w", encoding="utf-8") as f:
        for result in results:
            f.write(result)
    print("转码成功!转码后文件为:", file2)


if __name__ == '__main__':
    param = sys.argv      # 获取控制台
    if len(param) == 3:
        src_file = param[1]
        dest_file = param[2]
    elif len(param) == 1:
        src_file = "1998-01-2003版-带音.txt"
        dest_file = "utf8_1998-01-2003版-带音.txt"
    else:
        print("文件无效")
        sys.exit()
    main(src_file, dest_file)

程序运行

程序运行比较简单,相信会使用python就会看懂,故没有多少注释,如不懂可在下方留言。


 上一篇
Jetbrains产品永久破解方法 Jetbrains产品永久破解方法
1. 前言做Java开发和Python开发的人,或多或少知晓其对应的IDE,IntelliJ IDEA和Pycharm两块开发软件,虽然这两个软件很庞大,但是真是用起来很方便,快捷。这也是当前主流公司中使用的开发工具,当然我也正使用这两款软
2019-03-08
下一篇 
使用爬虫进行个人签名设计 使用爬虫进行个人签名设计
前言过年前到现在再沉浸在过年的愉悦与忙碌中。但是,每当亲戚谈论家庭时,不禁鸭梨山大,开始学习了。这里就使用一个小小的爬虫,去进行个性签名设计。 环境准备系统:win10 python版本:3.6 所需安装工具包:requests,lxml
2019-02-08
  目录