如何使用colab读取30GB的大型tar.xz

问题描述

我使用Google Colab将30GB的tar.xz文件下载到了我的G驱动器中。在Colab中提取和读取此文件夹时,我需要帮助。在tar文件夹中,有十个文件夹。是否可以单独阅读这些文件夹?我尝试了以下方法,但失败了。

  1. 解压缩G-drive中的30GB文件夹,但由于在G-Drive中读写文件的限制而失败。
  2. 我可以直接将文件下载到本地Colab目录,但是由于Colab的空间限制,我无法在本地目录中提取或读取文件

有关如何解决此问题的任何建议。 谢谢

解决方法

使用--wildcards选项只能提取tar文件中的目录。

!tar xf file.tar.xz --wildcards 'path_to/dir/*'

这里是example notebook

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...