当我们谈论加入或合并文档时,我们指的是将两个或多个文档组合成一个文件的过程。您可能想要这样做的原因有多种,例如更容易共享信息或创建单个合并文档。合并文档的另一个目的可能是创建一个包含来自多个文档的所有信息的统一文件。例如,您可能想要创建一个集中式文件,其中包含来自一个文档的所有文本、来自第二个文档的所有图像以及来自第三个文档的所有数据。
就像合并文件一样,在某些情况下,您可能还需要拆分文档以创建多个文档。当您需要创建包含不同数据集的单独报告或演示文稿时,拆分文件非常有用。或者,如果您需要向某人发送大型文档但不希望他们必须下载大型文件。如果您正在寻找一种独立于平台的解决方案来以编程方式合并或拆分数据文件,那么适用于 .NET 和 Java 的 GroupDocs.Merger API 可能是您的最终选择。这些 API 使 .NET 和 Java 开发人员能够在其文件合并应用程序中拆分或合并 PDF、Word、Excel 和 PowerPoint 文档、图表和电子书,以及合并 JPG、PNG、GIF 和 TIFF 图像。
要开始合并或拆分文档和图像,请安装所需版本的 GroupDocs.Merger(适用于 .NET 或 Java)和所有先决条件,以享受无缝体验。
请从下载部分下载MSI安装程序或DLL,通过NuGet,或使用程序包管理器控制台为 .NET 安装 GroupDocs.Merger:
如需更多帮助和信息,请查看详细的安装指南。
要安装 Java 版本的 GroupDocs.Merger API,您可以直接下载 JAR 文件或使用最新配置Java 中的 Maven 应用程序。
<repository>
<id>groupdocs-artifacts-repository</id>
<name>GroupDocs Artifacts Repository</name> <url>https://releases.groupdocs.com/java/repo/</url>
</repository>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-merger</artifactId>
<version>22.7</version>
</dependency>
请查看本指南以获得有关安装 GroupDocs.Merger for Java 的更多帮助。
在您的系统上为 .NET 或 Java 成功设置 GroupDocs.Merger 后,您可以检查一些用于合并或拆分文档以及交换、旋转、提取或删除文档页面的常见用例。
PDF文件已经成为文档共享和存储的标准,我们经常会因为各种原因需要合并PDF文件,例如将多个PDF文档的数据合并为一个文件以供同行评审。或者,将公司内联网文档中包含的图形和表格等资源集中起来,以便于参考。无论情况如何,适用于 .NET 和 Java 的 GroupDocs.Merger API 都加载了正确的工具集,供您合并 PDF 文件,同时保留源文档的文本和图形内容。
只需几行 C# 代码即可将 PDF 合并为一个文件,如下所示样本:
// Load the source PDF document
using (Merger merger = new Merger(@"c:\sample1.pdf"))
{
// Add a PDF file to merge
merger.Join(@"c:\sample2.pdf");
// Merge both PDF files and save the result
merger.Save(@"c:\merged.pdf");
} 除了合并 PDF 文件,您还可以选择合并 DOC、PPT 和XLS 格式 到 PDF 文档。为此,请使用以下 C# 代码:
将多个 PDF 文件合并为一个文档在 Java 中也很简单,如下面的代码所示:
// Load the source PDF document
Merger merger = new Merger("c:\sample1.pdf")
// Add another PDF document
merger.join("c:\sample2.pdf");
// Merge both PDF files and save the result
merger.save("c:\merged.pdf"); 多功能性和易用性是使 Microsoft Word、Excel 和 PowerPoint 在全世界如此流行的两个因素。这些软件应用程序使我们能够轻松创建不同类型的具有专业外观的文档。 Word 非常适合创建基于文本的文档,Excel 非常适合存储和处理数据,而 PowerPoint 非常适合创建演示文稿。您可以使用适用于 .NET 和 Java 的 GroupDocs.Merger API 合并任何这些文件类型。
您可以使用如下所示的 C# 代码 合并您的 Word 文档。还必须注意,此代码是通用的,也可用于合并 Excel 和 PowerPoint 文件。唯一的区别是替换文档名称和类型。例如,'sample1.docx'、'sample2.docx' 和 'merged.docx' 会将文档扩展名从 DOCX 更改为 XLSX 或 PPTX。
// Load the source DOCX file
using (Merger merger = new Merger(@"c:\sample1.docx"))
{
// Add another DOCX file to merge
merger.Join(@"c:\sample2.docx");
// Merge DOCX files and save the result
merger.Save(@"c:\merged.docx");
} GroupDocs.Meger for .NET API 的另一个非常有用的功能是合并来自不同文件的页面 根据指定的页码或范围将其放入一个文档中。以下 C# 代码可让您实现此目的:
string filePath = @"c:\sample1.docx";
string filePath2 = @"c:\sample2.docx";
string filePathOut = @"c:\output\result.docx";
JoinOptions joinOptions = new JoinOptions(1, 4, RangeMode.OddPages);
using (Merger merger = new Merger(filePath, loadOptions))
{
merger.Join(filePath2, joinOptions);
merger.Save(filePathOut);
} 还支持合并其他流行格式的文档,如 ODT、EPUB、TXT、TEX 和 HTML。请查看本指南以获得更多帮助。
就像在 .NET 中一样,Java 用户可以还可以使用下面给出的示例轻松组合他们的 Word 文档代码。同样的代码片段也可用于合并 Excel 和 PowerPoint 文档。在处理电子表格和演示文稿文件时,您只需替换文件名和扩展名。同样,请在此代码中用 XLSX 或 PPTX 替换 DOCX 扩展名。
// Load the source DOCX file
Merger merger = new Merger("c:\sample1.docx")
// Add another DOCX file to merge
merger.join("c:\sample2.docx");
// Merge DOCX files and save the result
merger.save("c:\merged.docx"); GroupDocs.Merger for Java 允许您将多个文档的页面合并到一个文件中。您可以指定要在生成的文档中合并的页面。为此,请使用下面给出的示例 Java 代码:
String filePath = "c:\sample.docx"; String filePath2 = "c:\sample2.docx"; String filePathOut = "c:\output\result.docx"; // Set the start and end page numbers in JoinOptions class. JoinOptions joinOptions = new JoinOptions(1, 2); // Merge selective pages using the join method Merger merger = new Merger(filePath); merger.join(filePath2 , joinOptions); merger.save(filePathOut);
有关在 Java 中合并其他格式文件(包括 OpenDocument、EPUB、TEX、TXT 和 HTML)的更多信息,请访问本指南。
合并或合并不同的光栅图像文件(如 PNG、JPG、TIFF 等)是为各种目的创建独特视觉效果的好方法。合并图像还可用于将多个图像组合成一个更大的图像、创建照片蒙太奇、从图像中删除不需要的元素,甚至创建拼贴画。如果您经常使用图像,则可以使用 GroupDocs.Merger API 合并 JPG、PNG、TIFF 和 GIF 等光栅图像。
要合并 JPG 图像文件,请使用如下所示的 C# 编码。您可以合并 JPG 图像水平或垂直取决于您的预期用途:
// Load the source image file
using (Merger merger = new Merger(@"c:\sample1.jpg"))
{
// Define image join options with horizontal join mode
ImageJoinOptions joinOptions = new ImageJoinOptions(ImageJoinMode.Horizontal);
// Add another image file to merge
merger.Join(@"c:\sample2.jpg", joinOptions);
// Define image join options with vertical join mode
joinOptions = new ImageJoinOptions(ImageJoinMode.Vertical);
// Add the next image file to merge
merger.Join(@"c:\sample3.jpg", joinOptions);
// Merge image files and save the result
merger.Save(@"c:\merged.jpg");
} 同样,您可以组合 PNG, 动图,以及 .NET 中的其他图像文件格式。
请使用下面共享的 Java 代码片段 合并 JPG 图像 文件。您可以选择垂直或水平合并图像:
// Load the source image file
Merger merger = new Merger("c:\sample1.jpg")
// Define image join options with horizontal join mode
ImageJoinOptions joinOptions = new ImageJoinOptions(ImageJoinMode.Horizontal);
// Add another image file to merge
merger.join("c:\sample2.jpg", joinOptions);
// Define image join options with vertical join mode
joinOptions = new ImageJoinOptions(ImageJoinMode.Vertical);
// Add the next image file to merge
merger.join("c:\sample3.jpg", joinOptions);
// Merge image files and save the result
merger.save("c:\merged.jpg"); 除了 JPG,您还可以结合 PNG 和 Java 中的 BMP 图片。
文档拆分是将单个文件分解为多个较小文档的过程。文件拆分的一些实际用途可以是将相关文档组织在单独的文件中,简化共享和协作过程,促进更轻松的编辑,并允许更有效地搜索和检索信息。 GroupDocs.Merger API 为您提供了在 .NET 和 Java 中无缝拆分不同格式文档所需的所有必要工具。
您可以根据各种拆分选项<在 .NET 中拆分 PDF、DOCX、XLSX、PPTX 和其他数据文件 例如通过准确的页码、通过起始页和结束页、偶数/奇数过滤器等。以下 C# 代码可让您按指定的页码拆分 PDF 文档。这将生成三个单独的文档,每个文档包含一个页面,如 SplitOptions 中所定义:
string filePath = @"c:\sample.pdf";
string filePathOut = @"c:\output\document_{0}.{1}";
// Define page numbers in SplitOptions
SplitOptions splitOptions = new SplitOptions(filePathOut, new int[] { 3, 6, 8 });
// Split the document based on the specified split options
using (Merger merger = new Merger(filePath))
{
merger.Split(splitOptions);
}您可以使用 .NET 的 GroupDocs.Merger 类似地拆分 DOCX、XLSX、PPTX 和其他文档。
用于拆分数据文件的相同选项在 Java 中也可用。在拆分 PDF 文件、Word、Excel 和 PowerPoint 文档时,您可以使用这些选项,例如定义页码、指定页面范围等。在下面共享的示例中,我们将使用特定页码将 PDF 文件拆分为三个单独的单页文档:
String filePath = "document.pdf";
String filePathOut = "document\_{0}.{1}";
// Specify page numbers and split the file into multiple single-page documents.
SplitOptions splitOptions = new SplitOptions(filePathOut, new int\[\] { 3, 6, 8 });
Merger merger = new Merger(filePath);
merger.split(splitOptions); 随意以相同的方式拆分您的 Word、Excel、PowerPoint 和其他 Java 文档。
除了合并或拆分数据文件外,您还可以在 GroupDocs.Merger API 的帮助下执行多种其他文件操作,例如提取、旋转、交换和删除文档页面。 .NET 和 Java 版本的 GroupDocs.Merger 都支持所有这些功能。那么,让我们看看其中的一些功能以及它们是如何工作的。
请使用以下 C# 代码从源 PDF 文档中提取特定页面:
string filePath = @"c:\sample.pdf";
string filePathOut = @"c:\output\result.pdf";
// Resultant document will contain pages 1 and 4
ExtractOptions extractOptions = new ExtractOptions(new int[] { 1, 4 });
using (Merger merger = new Merger(filePath))
{
merger.ExtractPages(extractOptions);
merger.Save(filePathOut);
} 要将 PDF 文档的特定页面旋转 90、180 或 270 度,请使用此 C# 代码。如需查看其他支持的文档操作,请访问此页面:
要将一个文档页面与另一个文档页面交换,请使用如下所示的 Java 代码:
String filePath = "c:\sample.pptx"; String filePathOut = "c:\output\result.pptx"; // Set page numbers to be swapped int pageNumber1 = 3; int pageNumber2 = 6; // Define swap options based on the selected page numbers SwapOptions swapOptions = new SwapOptions(pageNumber2, pageNumber1); Merger merger = new Merger(filePath); merger.swapPages(swapOptions); merger.save(filePathOut);
要删除一个或多个文档页面,请使用以下示例 Java 代码。要查看其他支持的文件操作,请查看此处的相关页面:
String filePath = "c:\sample.one";
String filePathOut = "c:\output\result.one";
// Define the pages to be removed
RemoveOptions removeOptions = new RemoveOptions(new int[] { 3, 5 });
// Process the page removal file operation
Merger merger = new Merger(filePath);
merger.removePages(removeOptions);
merger.save(filePathOut); 我们还提供免费在线应用来合并或拆分 PDF、DOCX、XLXS、PPTX 和 EPUB 文件。如果您希望将 Word 合并为 PDF、Excel 合并为 PDF、PowerPoint 合并为 PDF、合并 JPG、PNG、BMP 和许多其他数据文件,请务必尝试免费应用程序。