如何使用iTextSharp将PDF与可填写的表单字段合并/合并?

问题描述

| 使用
iTextSharp
,如何将多个PDF合并为一个PDF,而又不丢失每个PDF中的“表单域”及其属性? (我希望有一个使用来自数据库的流的示例,但文件系统也可以) 我发现此代码可以正常工作,但可以使我的PDF变得平整,所以我无法使用它。 更新 @Mark Storer-这是我现在根据您的反馈使用的代码(请参阅下文),但是保存后给我一个损坏的文档。我分别测试了每个代码部分,似乎在下面显示
MergePdfForms
函数中失败。我显然不想使用示例中的
renameFields
部分,因为我需要字段名称保持“原样”。
Public Sub MergePdfForms(ByVal pdfFiles As ArrayList,ByVal outputPath As String)
    Dim ms As New IO.MemoryStream()
    Dim copier As New PdfcopyFields(ms)
    For Each pfile As String In pdfFiles
        Dim reader As New PdfReader(pfile)
        copier.AddDocument(reader)
    Next
    SaveMemoryStream(ms,outputPath)
    copier.Close()
End Sub

Public Sub SaveMemoryStream(ms As IO.MemoryStream,FileName As String)
    Dim outStream As IO.FileStream = IO.File.OpenWrite(FileName)
    ms.Writeto(outStream)
    outStream.Flush()
    outStream.Close()
End Sub
    

解决方法

        PDF中的字段具有不寻常的属性:具有相同名称的所有字段都是相同的字段。他们共享价值。当表单引用相同的人并且您对表单有一个不错的命名方案时,这很方便。要将单个表单的20个实例放入一个PDF中,这并不方便。 至少可以说,这使得合并多种形式具有挑战性。最常见的选择(多亏了iText),是在合并表单之前将其展平,这时您不再需要合并表单,问题就消失了。 另一个选择是在合并字段之前重命名它们。这会使以后的数据提取变得困难,可能破坏脚本,并且通常是PITA。这就是为什么扁平化如此受欢迎的原因。 iText中有一个称为“ 4”的类,它将正确地将字段从一个文档复制到另一个文档中……它还将正确地合并具有相同名称的字段,以使它们确实共享一个值,而Acrobat / Reader不会\'在向用户显示文件之前,不必对文件进行大量额外的工作即可获得该文件。 但是,
PdfCopyFields
不会为您重命名字段。为此,您需要从有问题的ѭ7中获取
AcroFields
对象,并在将文档与
PdfCopyFields
合并之前在每个字段上调用call8ѭ。 所有这些都是针对基于\“ AcroForm \”的PDF表单。如果您正在处理XFA表单(LiveCycle Designer中的表单),则所有选择均不适用。您必须处理XML,很多。 如果您必须将两者的形式结合起来,那么天堂将为您提供帮助。 因此,就算您正在使用AcroForm字段,代码也可能看起来像这样(原谅我的Java):
public void mergeForms(String outpath,String inPaths[]) {
  PdfCopyFields copier = new PdfCopyFields(new FileOutputStream(outpath) );
  for (String curInPath : inPaths) {
    PdfReader reader = new PdfReader(curInPath);
    renameFields(reader.getAcroFields());

    copier.addDocument(reader);
  }
  copier.close();
}

private static int counter = 0;
private void renameFields(AcroFields fields) {
  Set<String> fieldNames = fields.getFields().keySet();
  String prepend = String.format(\"_%d.\",counter++);

  for(String fieldName : fieldNames) {
    fields.rename(fieldName,prepend + fieldName);
  }
}
理想情况下,ѭ2还可以创建一个名为prepend \'s-value的通用字段对象,并使文档中的所有其他字段成为其子级。这将使Acrobat / Reader的生活更加轻松,并且在从Acrobat关闭生成的PDF时避免了明显不必要的“保存更改?”请求。 是的,这就是为什么Acrobat有时会在您“什么都不做”时要求您保存更改! Acrobat在幕后做了一些事情。     ,        您也可以使用此代码...。它将合并所有pdf文件,而不会丢失字段值。
    Document document = new Document();
    try
        {         
           string destinationfile = desktopPath.Replace(@\"d:\\outputfile.pdf\");
           PdfCopyFields copier = new PdfCopyFields(new FileStream(destinationfile,FileMode.Create));
            PdfImportedPage page;

            //Loops for each file that has been listed
            foreach (string filename in fileList)
            {
                flag++;
                try
                {
                    //The current file path
                    string filePath = sourcefolder + filename;

                    PdfReader reader = new PdfReader(filePath);
                    copier.AddDocument(reader);

                }
                catch
                {

                }
            }
            copier.Close();
        }