Python解压缩Zip和Rar⽂件到指定⽬录#__author__ = 'Joker'
# -*- coding:utf-8 -*-
import urllib
import os
import os.path
import zipfile
from zipfile import *
import sys
reload(sys)
sys.setdefaultencoding('gbk')
rootdir = "F:/50_GIS/1000_Tools" # 指明被遍历的⽂件夹
zipdir = "F:/000_Terrain/zipdir" # 存储解压缩后的⽂件夹
#Zip⽂件处理类
class ZFile(object):
压缩文件怎么解压def __init__(self, filename, mode='r', basedir=''):
self.filename = filename
de in ('w', 'a'):
self.zfile = zipfile.ZipFile(filename, de, compression=zipfile.ZIP_DEFLATED)
else:
self.zfile = zipfile.ZipFile(filename, de)
self.basedir = basedir
if not self.basedir:
self.basedir = os.path.dirname(filename)
def addfile(self, path, arcname=None):
path = place('//', '/')
if not arcname:
if path.startswith(self.basedir):
arcname = path[len(self.basedir):]
else:
arcname = ''
self.zfile.write(path, arcname)
def addfiles(self, paths):
for path in paths:
if isinstance(path, tuple):
self.addfile(*path)
else:
self.addfile(path)
def close(self):
self.zfile.close()
def extract_to(self, path):
for p in self.zfile.namelist():
def extract(self, filename, path):
if dswith('/'):
f = os.path.join(path, filename)
dir = os.path.dirname(f)
if not ists(dir):
os.makedirs(dir)
file(f, 'wb').write(ad(filename))
#创建Zip⽂件
def createZip(zfile, files):
z = ZFile(zfile, 'w')
z.addfiles(files)
z.close()
#解压缩Zip到指定⽂件夹
def extractZip(zfile, path):
z = ZFile(zfile)
z.close()
#解压缩rar到指定⽂件夹
def extractRar(zfile, path):
rar_command1 = " x -ibck %s %s" % (zfile, path)
rar_command2 = r'"C:\" x -ibck %s %s' % (zfile, path)
if os.system(rar_command1) == 0:
print "Path OK."
else:
if os.system(rar_command2) != 0:
print "Error."
else:
print "Exe OK"
#获得⽂件名和后缀
def GetFileNameAndExt(filename):
(filepath,tempfilename) = os.path.split(filename);
(shotname,extension) = os.path.splitext(tempfilename);
return shotname,extension
#定义⽂件处理数量-全局变量
fileCount = 0
#递归获得rar⽂件集合
def getFiles(filepath):
#遍历filepath下所有⽂件,包括⼦⽬录
files = os.listdir(filepath)
for fi in files:
fi_d = os.path.join(filepath,fi)
if os.path.isdir(fi_d):
getFiles(fi_d)
else:
global fileCount
global zipdir
fileCount = fileCount + 1
# print fileCount
fileName = os.path.join(filepath,fi_d)
filenamenoext = GetFileNameAndExt(fileName)[0]
fileext = GetFileNameAndExt(fileName)[1]
# 如果要保存到同⼀个⽂件夹,将⽂件名设为空
filenamenoext = ""
zipdirdest = zipdir + "/" + filenamenoext + "/"
if fileext in ['.zip','.rar']:
if not os.path.isdir(zipdirdest):
os.mkdir(zipdirdest)
if fileext == ".zip" :#
print str(fileCount) + " -- " + fileName
# unzip(fileName,zipdirdest)
extractZip(fileName,zipdirdest)
elif fileext == ".rar":
print str(fileCount) + " -- " + fileName
extractRar(fileName, zipdirdest)
#递归遍历“rootdir”⽬录下的指定后缀的⽂件列表
getFiles(rootdir)
Zip处理:
⽂件处理参考:
读取Zip⽂件
随便⼀个zip⽂件,我这⾥⽤了bb.zip,就是⼀个⽂件夹bb,⾥⾯有个⽂件aa.txt。
import zipfile
# 默认模式r,读
azip = zipfile.ZipFile('bb.zip') # ['bb/', '']
# 返回所有⽂件夹和⽂件
print(azip.namelist())
# # 返回该zip的⽂件名
print(azip.filename)
# 压缩⽂件⾥bb⽂件夹下的aa.txt
azip_info = info('')
# 原来⽂件⼤⼩
print(azip_info.file_size)
# 压缩后⼤⼩
print(azip_infopress_size)
# 这样可以求得压缩率,保留⼩数点后两位
print('压缩率为{:.2f}'.format(azip_info.file_size/azip_infopress_size))
可以看到打开⽅式并不是想象中的open,⽽是ZipFile。⽤namelist()可以返回⾥⾯所有的⽂件夹和⽂件路径。getinfo可以获得某路径下⽂件的信息,如上。
还能直接读取压缩包⾥⽂件的内容,下⾯两种⽅法得到的结果是⼀样的。需要注意的是,读取出来的数据好像是字节形式的,解码成utf-8就好。
# 可以直接读取⾥⾯的内容, 不过貌似是字节形式.需要解码回utf-8.参数也可以传ZiInfo, 如b
a = ad('').decode('utf-8')
print(a)
# 打开⽂件再读取,好像⽐上⾯⿇烦
b = azip.open(azip_info)
ad().decode('utf-8'))
azip.close()
⽤完资源后记得主动close。
解压Zip
最为关键的功能,⼀句搞定。默认解压在当前⼯作⽬录,可以指定解压⽬录。
新建Zip⽂件
不仅能读还能写。新建压缩包的时候,可以选择压缩算法,⽐如DEFLATED和LZMA
# 新建压缩包,放⽂件进去,若压缩包已经存在,将覆盖。可选择⽤a模式,追加
azip = zipfile.ZipFile('bb.zip', 'w')
# 必须保证路径存在,将bb件夹(及其下aa.txt)添加到压缩包,压缩算法LZMA
azip.write('D:/', compress_type=zipfile.ZIP_LZMA)
# 写⼊⼀个新⽂件到压缩包中,data是该⽂件的具体内容,可以是str或者是byte。
# 这⾥是新建⼀个bb⽂件夹,其下再新建⼀个cc.txt,将hello world写⼊到⽂本中
azip.writestr('', data='Hello World', compress_type=zipfile.ZIP_DEFLATED)
# 关闭资源
azip.close()
上⾯有两个⽅法⽐较类似,注意区分。
write指的是将已经存在的⽂件复制到压缩包,包括路径中的所有⽂件夹河其下的⽂件。
writestr是直接在压缩包⾥新建⽂件夹和⽂件,data参数是往该⽂件中写⼊的内容。
最终压缩包⾥会被添加bb⽂件夹,其下有aa.txt和cc.txt
将整个⽂件夹添加到压缩包中
如果我们这样写,想象着能添加bb⽂件夹下所有内容到压缩包中,那就不对了。这样添加,只会把bb⽂件夹复制过去,也仅仅如此,⾥⾯的⽂件不会添加到压缩包。最后得到的只是⼀个空⽂件夹。
azip.write(r'D:/bb', compress_type=zipfile.ZIP_LZMA)
那怎么办呢?只好递归查添加了,os.walk刚好可以帮助我们。
for current_path, subfolders, filesname in os.walk(r'D:\bb'):
print(current_path, subfolders, filesname)
# filesname是⼀个列表,我们需要⾥⾯的每个⽂件名和当前路径组合
for file in filesname:
# 将当前路径与当前路径下的⽂件名组合,就是当前⽂件的绝对路径
azip.write(os.path.join(current_path, file))
# 关闭资源
azip.close()
正确选⽤变量,元组中第⼀个是当前路径,⽽第三个是当前路径下的⽂件,两者⼀组合刚好就是⽂件的绝对路径。
这样就可以实现添加整个⽂件夹添加到压缩包了。⽽且是这些路径下所有的⽂件夹和其下的⽂件全部添加。也就是说,保留了原⽂件夹的结构层次。
shutil添加压缩包和解压缩
shuitl模块有个函数,可以⽅便地添加整个整个⽂件夹到压缩包。
# 第⼀个参数是归档⽂件名称,第⼆个参数是指定的格式,不仅是⽀持zip,第三个参数是要压缩⽂件/⽂件夹的路径
shutil.make_archive('archive_name', 'zip', r'F:\IDE Setting')
# _archive_formats() 可以查看⽀持的格式
当然也可以解压缩,可指定解压⽬录,否则默认解压到当前⼯作⽬录。
shutil.unpack_archive(r'D:\bb.zip')
# _unpack_formats() 可以查看⽀持的格式
发布评论