将 accessdb 表导出到 csv

问题描述

一直在研究一段 Java 代码，以将一些表从 accessdb 导出到 CSV。我想将此代码部署为 Lambda 函数。我试过使用 jackcess，但以下

        try {
            String dateOfExtraction = LocalDateTime.Now().toString();
            Database db = DatabaseBuilder.open(new File("java-runtime/src/access_db_file.accdb"));
            System.out.println(db.getTableNames());
            ExportUtil.exportFile(db,"table_name",new File("table_name" + dateOfExtraction + ".csv"));
        } catch (IOException e) {
            e.printstacktrace();
        }

抛出错误： java.io.FileNotFoundException: given file does not exist: C:\Users\john.doe.ctr\Desktop\Work\table_name

我在 mac 上运行我的代码，这个文件路径来自为我提供数据库的用户。这是某种权限错误吗？我应该只使用 ucanaccess 吗？我不能使用任何 ucanaccess 命令行工具，我必须在 lambda 中运行它。 System.out.println(db.getTableNames()); 行完全按预期工作，并打印 accessdb 中所有表名的列表。

解决方法

代码中可能有几个问题。

首先，您使用 LocalDateTime.now().toString() 作为保存信息的 CSV 文件的文件名的一部分。它会给你类似的东西：

2021-05-02T23:42:03.282

在某些操作系统中——你提到了 MacOS，但它应该允许你创建一个具有该名称的文件——这个名称可能是问题的一个可能原因；请考虑使用不太容易出错的东西，例如 System.currentTimeMillis:

String filename = "table_name" + System.currentTimeMillis() + ".csv";
ExportUtil.exportFile(db,"table_name",new File(filename));

话虽如此，请注意，在 AWS Lambda 函数中，您可能需要将结果存储在外部存储中，通常是 S3：您有能力写入文件系统，但在使用时通常是相关的临时文件，而不是持久存储。请考虑以下代码片段。

// Here you can have a problem as well when trying to access the filesystem
// to read the Access file,but the API does not give you another option
// Probably deploying (https://docs.aws.amazon.com/lambda/latest/dg/lambda-java.html)
// your lambda function as a container (https://docs.aws.amazon.com/lambda/latest/dg/java-image.html) 
// and include your database file
Database db = DatabaseBuilder.open(new File("java-runtime/src/access_db_file.accdb"));
System.out.println(db.getTableNames());
String filename = "table_name" + System.currentTimeMillis() + ".csv";
// Instead of writing to a file,write to a byte array through a writer
try (ByteArrayOutputStream output = new ByteArrayOutputStream();
     BufferedWriter writer = new BufferedWriter(
         new OutputStreamWriter(output));
) {
  // Dump data
  ExportUtil.exportWriter(db,writer);
  // Just in case
  writer.flush();
  // Get actual information
  byte[] data = output.toByteArray();
  // Save data to S3: please,consider refactor and organize the code
  S3Client s3 = ...; // Initialize as appropriate
  String bucketName = "your-bucket";
  String objectKey = filename; // object key,same as filename,for example
  // Perform actual S3 request
  PutObjectResponse response = s3.putObject(
    PutObjectRequest.builder()
      .bucket(bucketName)
      .key(objectKey)
      .build(),RequestBody.fromBytes(data)
  );
} catch (IOException e) {
  e.printStackTrace();
}

从完全不同的角度来看，问题可能是因为 table_name 是 linked table。创建链接表时，您需要定义链接信息的路径：就您而言，此信息可能存储在您客户端原始计算机的 C:\Users\john.doe.ctr\Desktop\Work\table_name 中。

如果您有 MS Access 程序，您可以在 Linked Table Manager 的帮助下验证这是否是实际问题。

如果您没有 MS Access 程序，您也可以use the Database class。请考虑以下示例：

Database db = DatabaseBuilder.open(new File("java-runtime/src/access_db_file.accdb"));
Table table = db.getTable("table_name");
boolean isLinkedTable = db.isLinkedTable(table);

如果表是链接的，你需要两件事：一方面，链接信息本身，另一方面，你需要提供一个方便的 LinkResolver 接口实现，可能通过扩展 {{3} }.该界面基本上为您提供了将链接表的位置映射到不同路径的能力。请考虑查看 CustomLinkResolver 以获得诸如实施的方便示例。

例如，以这样的方式思考：

public class RemapLinkResolver implements LinkResolver {

  // Maintain a correspondence between the original linked db file
  // and the same db in your new filesystem 
  private Map<String,String> dbLinkeeFileRemap = new HashMap<>();

  public void remap(String originalLinkeeFileName,String newLinkeeFileName) {
    this.dbLinkeeFileRemap.put(originalLinkeeFileName,newLinkeeFileName);
  }

  @Override
  public Database resolveLinkedDatabase(Database linkerDb,String linkeeFileName)
    throws IOException {
    // if linker is read-only,open linkee read-only
    boolean readOnly = ((linkerDb instanceof DatabaseImpl) ?
                       ((DatabaseImpl)linkerDb).isReadOnly() : false);
    String newLinkeeFileName = this. dbLinkeeFileRemap.get(linkeeFileName);
    if (newLinkeeFileName != null) {
      return new DatabaseBuilder(new File(newLinkeeFileName))
        .setReadOnly(readOnly).open();
    }

    // Fallback to default
    return LinkResolver.DEFAULT.resolveLinkedDatabase(linkerDb,linkeeFileName);
  }
}

然后，在您的代码中使用它：

Database db = DatabaseBuilder.open(new File("java-runtime/src/access_db_file.accdb"));
RemapLinkResolver linkResolver = new RemapLinkResolver();
linkResolver.remap(
  "C:\Users\john.doe.ctr\Desktop\Work\table_name","java-runtime/src/table_name.accdb"
);
db.setLinkResolver(linkResolver);
// Continue as usual

我希望你能理解这个想法，请根据需要调整路径和代码。

Jccs 的建议看起来很可靠。您也可以尝试/确认/详细说明以下一些内容吗？

有一件事是你说你的 mac 上有代码，但文件路径来自另一个用户。您是否以某种方式隐式或显式引用了 Mac 上不可用的文件夹，因此您无法访问无效的文件夹路径？ Jackcess 可能可以在文件夹中创建文件，但是如果缺少导出的父文件夹路径的一部分，则可能无法或没有建立必要的子文件夹来创建文件并引发错误隐含的？
鉴于我想象它在云堆栈中运行，Lambda 是否需要额外配置才能访问上一条评论中正在播放的文件夹路径？
jackess 是否要求您在打开文件进行文件写入之前初始化/创建文件？从 API 上看似乎不是。

4.你能暂时硬编码 new File("table_name" + dateOfExtraction + ".csv")" 来代替 new File("steve.csv") 之类的简单东西。我特别想知道你的错误信息相应地更新以抱怨它无法访问该文件夹中的 steve.csv。

aws-lambda jackcess java java ms-access ucanaccess