![Pandas数据分析快速上手500招(微课视频版)](https://wfqqreader-1252317822.image.myqcloud.com/cover/35/47216035/b_47216035.jpg)
上QQ阅读APP看书,第一时间看更新
050 从压缩格式的文本文件中读取数据
此案例主要通过在read_csv()函数中设置compression参数值,实现从压缩格式的文本文件中读取数据,并据此创建DataFrame。当在Jupyter Notebook中运行此案例代码之后,将从压缩文件(myspace.zip)中读取该压缩文件包含的文本文件(myspace.txt)的数据,效果分别如图050-1和图050-2所示。
![](https://epubservercos.yuewen.com/DC5573/26580753209033106/epubprivate/OEBPS/Images/Figure-P61_4098.jpg?sign=1738883683-TFb6iuTA7BRARG1jHVF1ZATFa5oMJPHK-0-5e4a0fb4838d721784d42fd2d4186435)
图050-1
![](https://epubservercos.yuewen.com/DC5573/26580753209033106/epubprivate/OEBPS/Images/Figure-P61_4099.jpg?sign=1738883683-CQYqgfP0QTPwqtM2bquSFTprPr7GNkEF-0-f2c15249f57b86d79775f32c857c46ee)
图050-2
主要代码如下。
![](https://epubservercos.yuewen.com/DC5573/26580753209033106/epubprivate/OEBPS/Images/Figure-P62_35774.jpg?sign=1738883683-NFwe6AZUxyH55Ut3xf2TFM6zoYst0DBn-0-b73a212d80b73fe1cb0e7fc758b6f277)
在上面这段代码中,pd.read_csv('myspace.zip',delim_whitespace=True,compression='zip')表示读取压缩文件(myspace.zip)的数据,参数compression='zip'表示压缩格式是zip。如果压缩文件(myspace.zip)的压缩格式是zip,也可以省略compression参数值,即pd.read_csv('myspace.zip',delim_whitespace=True)也能实现完全相同的功能。如果压缩文件(myspace.arj)的压缩格式是zip,则必须设置compression='zip',即执行pd.read_csv('myspace.arj',delim_whitespace=True,compression='zip')才能正确读取压缩文件(myspace.arj)的数据,执行pd.read_csv('myspace.arj',delim_whitespace=True)代码将报错。
此案例的主要源文件是MyCode\H197\H197.ipynb。