将Excel文件转换为CSV并以JSON格式读取其内容

问题描述

在我的程序中上传excel文件时,需要将其转换为CSV文件才能读取。该过程运行正常,我正在使用asyc/await,但是,每当我尝试使用Node中的csvtojson包读取文件时,都无法正确读取文件。如果我直接使用CSV文件,则可以正常工作。发生转换时会出现问题。

product.js

const multer = require('multer');
const express = require('express');
const router = express.Router();
const csv = require('csvtojson');
const fs = require('fs');
const xlsx = require('node-xlsx');

router.post('/upload',upload.single('singleFile'),async (req,res) => {
    let csvFilePath = req.file.path;
    let fileType = req.file.mimetype;

    const convertToCSV = async _ => {
        console.log("2");
        if (fileType === 'application/vnd.openxmlformats-officedocument.spreadsheetml.sheet' ||
            fileType === 'application/vnd.ms-excel') {
            let obj = xlsx.parse(csvFilePath);
            let rows = [];
            let writeStr = "";

            for (let i = 0; i < obj.length; i++) {
                let sheet = obj[i];
                for (let j = 0; j < sheet['data'].length; j++) {
                    rows.push(sheet['data'][j]);
                }
            }

            //creates the csv string to write it to a file
            for (let i = 0; i < rows.length; i++) {
                writeStr += rows[i].join(",") + "\n";
            }

            console.log("3");
            fs.writeFile("csv/out.csv",writeStr,function (err) {
                if (err) {
                    return res.status(400).send({'error': err});
                }
                console.log("4");
                console.log("out.csv was saved in the current directory!");
            });
        }
    }
    console.log("1");
    await convertToCSV().then(async _ => {
        console.log("5");
        const jsonArray = await csv({flatKeys: true})
            .fromFile(csvFilePath)
            .then(async (jsonObj) => {
                console.log("6");
                console.log(jsonObj[0]);
                ...
                
                //Few more functions
                
            }).catch(err => {
                return res.status(400).send(err);
            });
    });
});

我的控制台日志如下

1
2
3
5
4
out.csv was saved in the current directory!
6
{
  'PK\u0003\u0004\u0014\u0000\u0006\u0000\b\u0000\u0000\u0000!\u0000b�h^\u0001\u0000\u0000�\u0004\u0000\u0000\u0013\u0000\b\u0002[Content_Types].xml �\u0004\u0002(�\u0000\u0002\u0000\u0000\
u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u00

如果上传了新的CSV文件或使用了现有的CSV,则console.log(jsonObj[0]);输出

{
  'Column1': 'Column 1 Data',field2: 'field2 Data',field3: 'field 3 Data',Categories: 'categories',....
}

我在await之前添加fs.writeFile,但是出现了同样的问题。在目录csv/

下保存了两个文件
c33129f3bdef482657992dbf452d2c1b
out.csv

并且读取前一个文件内容(假设,因为它们非常相似)并且不读取out.csv

更新

fs.writeFile周围包裹了一个诺言,现在已订购了控制台,但是读取的数据的输出仍然相同:

 const convertToCSV = async _ => {
        return new Promise(((resolve,reject) => {
            console.log("2");
            ....

                console.log("3");
                fs.writeFile("csv/out.csv",function (err) {
                    if (err) {
                        return res.status(400).send({'error': err});
                    }
                    console.log("4");
                    console.log("out.csv was saved in the current directory!");
                    resolve();
                });
            }
        }));
    }

控制台日志

1
2
3
4
out.csv was saved in the current directory!
5
6
{
  'PK\u0003\u0004\u0014\u0000\u0006\u0000\b\u0000\u0000\u0000!\u0000b�h^\u0001\u0000\u0000�\u0004\u0000\u0000\u0013\u0000\b\u0002[Content_Types].xml �\u0004\u0002(�\u0000\u0002\u0000\u0000\
u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u00

解决方法

您不必等待fs.writeFile("csv/out.csv",这就是为什么在控制台中5早于4的原因。 您应该将函数内容包装到Promise中:

const convertToCSV = async _ => {
  return new Promise((resolve,reject) => {
     console.log("2");
     ...
     console.log("3");
     fs.writeFile("csv/out.csv",writeStr,function (err) {
        if (err) {
          // I'd prefer to call "reject" here and add try/catch outside for sending 400
          return resolve(res.status(400).send({'error': err}));
        }
        console.log("4");
        console.log("out.csv was saved in the current directory!");
        resolve();
     });
  })
)

还要阅读csvFilePath,其中包含Excel文件名,而不包含以csv/out.csv名称存储的CSV。