nodejs pdf解析在特定字符串后获取值

问题描述

我的目标是在预定义文本之后获取某个字符串。在这种情况下,我想读取以下值:

required value

我发现这可以使用正则表达式,因此我尝试了这个:

 const fs = require("fs");
 const PDFParser = require("pdf2json");

 // Get all the filenames from the patients folder
 const files = fs.readdirsync("templates");

 // All of the parse patients
 let patients = [];

// Make a IIFE so we can run asynchronous code
(async () => {

// Await all of the patients to be passed
// For each file in the patients folder
await Promise.all(files.map(async (file) => {

    // Set up the pdf parser
    let pdfParser = new PDFParser(this,1);

    // Load the pdf document
    pdfParser.loadPDF(`templates/${file}`);

    // Parsed the patient
    let patient = await new Promise(async (resolve,reject) => {

        // On data ready
        pdfParser.on("pdfParser_dataReady",(pdfData) => {

            // The raw PDF data in text form
            const raw = pdfParser.getRawTextContent().replace(/\r\n/g," ");

            // Return the parsed data
            
            resolve({
                gesamtbetrag: /Amount\s(:*?)--/i.exec(raw)[1].trim()
            });

        });

    });

    // Add the patient to the patients array
    patients.push(patient);

}));

// Save the extracted information to a json file
fs.writeFileSync("patients.json",JSON.stringify(patients));

 })();

我收到错误,我的数组在位置 1 为空:

无法读取 null 的属性“1”

谢谢

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)