使用iTextSharp,如何将多个PDF合并到一个PDF中,而不丢失每个PDF中的表单字段及其属性?
(我更喜欢使用数据库中的流的例子,但是文件系统也可以)
我找到了工作的这段代码,但它使我的PDF文件变平了,所以我不能使用它。
更新
@Mark -这是我现在根据您的反馈使用的代码(见下面),但是它在保存后给了我一个损坏的文档。我分别测试了每个代码部分,它似乎在下面所示的MergePdfForms函数中失败了。显然,我不想使用示例中的renameFields部分,因为我需要字段名保持“原样”。
Public Sub MergePdfForms(ByVal pdfFiles As ArrayList, ByVal outputPath As String)
Dim ms As New IO.MemoryStream()
Dim copier As New PdfCopyFields(ms)
For Each pfile As String In pdfFiles
Dim reader As New PdfReader(pfile)
copier.AddDocument(reader)
Next
SaveMemoryStream(ms, outputPath)
copier.Close()
End Sub
Public Sub SaveMemoryStream(ms As IO.MemoryStream, FileName As String)
Dim outStream As IO.FileStream = IO.File.OpenWrite(FileName)
ms.WriteTo(outStream)
outStream.Flush()
outStream.Close()
End Sub发布于 2011-06-13 17:10:52
PDF中的字段具有一个不寻常的属性:所有具有同名的字段都是相同字段。他们有共同的价值。当表单引用同一个人,并且您有一个很好的跨窗体命名方案时,这是非常方便的。当您想将单个表单的20个实例放入单个PDF中时,这是不方便的。
至少可以说,这使得合并多个表单具有挑战性。最常见的选项(多亏了iText)是在合并表单之前将表单扁平化,此时不再是合并表单,问题就解决了。
另一种选择是在合并字段之前重命名它们。这可能会使以后的数据提取变得困难,可能会破坏脚本,而且通常是一个皮塔。这就是为什么扁平化更受欢迎的原因。
iText中有一个名为PdfCopyFields的类,它将正确地将字段从一个文档复制到另一个文档.它还将正确地合并同名字段,以便它们真正地共享单个值,Acrobat/Reader在向用户显示文件之前不必对文件进行大量额外的工作。
但是,PdfCopyFields不会为您重命名字段。要做到这一点,您需要从相关的AcroFields对象中获取PdfReader对象,并在将文档与PdfCopyFields合并之前对每个字段调用renameField(String, String)。
所有这些都是为了"AcroForm"-based PDF表单。如果您正在处理XFA表单(来自LiveCycle设计器的表单),那么所有的赌注都取消了。你必须处理好XML,很多。
如果你必须把两者的形式结合起来,上帝就会帮助你。
因此,在使用AcroForm字段时,代码可能如下所示(请原谅我的Java):
public void mergeForms(String outpath, String inPaths[]) {
PdfCopyFields copier = new PdfCopyFields(new FileOutputStream(outpath) );
for (String curInPath : inPaths) {
PdfReader reader = new PdfReader(curInPath);
renameFields(reader.getAcroFields());
copier.addDocument(reader);
}
copier.close();
}
private static int counter = 0;
private void renameFields(AcroFields fields) {
Set<String> fieldNames = fields.getFields().keySet();
String prepend = String.format("_%d.", counter++);
for(String fieldName : fieldNames) {
fields.rename(fieldName, prepend + fieldName);
}
}理想情况下,renameFields还将创建一个名为prepend的泛型字段对象,并在文档中创建它的子字段中的所有其他字段。这将使Acrobat/Reader的生活更容易,并避免明显不必要的“保存更改?”关闭Acrobat生成的PDF时请求。
是的,这就是为什么Acrobat有时会要求您保存更改,而您没有做任何事情!杂技演员在幕后做了一些事情。
发布于 2013-01-09 13:40:56
您也可以使用此代码..。它将合并所有pdf文件而不会丢失字段值。
Document document = new Document();
try
{
string destinationfile = desktopPath.Replace(@"d:\outputfile.pdf");
PdfCopyFields copier = new PdfCopyFields(new FileStream(destinationfile, FileMode.Create));
PdfImportedPage page;
//Loops for each file that has been listed
foreach (string filename in fileList)
{
flag++;
try
{
//The current file path
string filePath = sourcefolder + filename;
PdfReader reader = new PdfReader(filePath);
copier.AddDocument(reader);
}
catch
{
}
}
copier.Close();
}https://stackoverflow.com/questions/6326506
复制相似问题