一. 前言
由于項目需要編寫大量的材料,以及各種簽字表格、文書等,最后以PDF作為材料交付的文檔格式,過程文檔時有變化或補充,故此處理PDF文檔已經成為日常工作的一部分。
網上有各種PDF處理工具,總是感覺用得不跟手。最后回顧自己的需求總結為以下幾項:
1.可以便捷、快速的對多份PDF進行合并。
2.可以從源PDF選取指定頁碼進行合并。
3.可以從單個PDF提取特定頁碼(拆分PDF)。
4.對多個PDF分組,合并作為最終PDF的導航書簽,可用作快速定位。
5.統一合成后PDF頁面尺寸,如統一為A4幅面。
6.操作盡量簡便,支持文件拖放,不需要花巧的東西。
二、最終效果
首先,我們看看最終成品:
①.可以批量添加多個PDF到合并列表,也可以從資源管理器將文件批量拖進來實現添加。
②.定義分組標題對文件進行分組,并作為合并后PDF的書簽。
③.將列表中PDF批量合并到一個文件中。如果只有一個PDF,而且定義了頁碼范圍,則轉換為拆分功能。
④.顯示PDF總頁數,如果只需提取部分內容,可以定義頁碼范圍。
⑤.可以更改合并后PDF頁面的尺寸,統一為A4、B4或A5幅面。
三、功能實現
搜索發現github有個開源的PdfBinder1.2(https://github.com/schourode/pdfbinder)比較接近想要的效果,本著能省即省、成本最低、能效更高的原則,直接以此為基礎進行擴展,開發自身所需的功能。
1.添加文件
這個比較簡單,點擊按鈕后彈出選擇對話框,將選擇的文件逐一加到ListBox中。
private void addFileButton_Click(object sender, EventArgs e){
if (addFileDialog.ShowDialog() == DialogResult.OK)
{
foreach (string file in addFileDialog.FileNames)
{
AddInputFile(file);
}
UpdateUI();
}
}
其中AddInputFile函數單獨編寫是為了在拖放事件中復用。
public void AddInputFile(string file){
int Pages = 0;
switch (Combiner.TestSourceFile(file, out Pages))
{
case Combiner.SourceTestResult.Unreadable:
MessageBox.Show(string.Format(resources.GetString("Error.Unreadable.Text"), file), resources.GetString("Error.Unreadable.Title"), MessageBoxButtons.OK, MessageBoxIcon.Error);
break;
case Combiner.SourceTestResult.Protected:
MessageBox.Show(string.Format(resources.GetString("Error.Protected.Text"), file), resources.GetString("Error.Protected.Title"), MessageBoxButtons.OK, MessageBoxIcon.Hand);
break;
case Combiner.SourceTestResult.Ok:
FileListBox.Items.Add(new PdfInfo() { Fullname = file, Filename = Path.GetFileName(file), Ranges = "", TotalPages = Pages });
break;
}
}
這里對PDF文件有效性進行了檢查,而且添加到ListBox的是PdfInfo對象,它還記錄了總頁數、提取的頁面范圍等信息。
文件拖放的實現:
private void FileListBox_DragEnter(object sender, DragEventArgs e){
e.Effect = e.Data.GetDataPresent(DataFormats.FileDrop, false) ? DragDropEffects.All : DragDropEffects.None;
}
private void FileListBox_DragDrop(object sender, DragEventArgs e){
var fileNames = (string[])e.Data.GetData(DataFormats.FileDrop);
Array.Sort(fileNames);
foreach (var file in fileNames)
{
AddInputFile(file);
}
UpdateUI();
}
2.文件分組(書簽)
using BookmarkName = System.String;
private void addBookmarkButton_Click(object sender, EventArgs e){
if (FileListBox.SelectedIndex < 0) return;
BookmarkName bookmark = "";
if (FileListBox.SelectedItem is BookmarkName)
bookmark = (BookmarkName)FileListBox.SelectedItem;
else
{
bookmark = ((PdfInfo)FileListBox.SelectedItem).Filename;
if (bookmark.Contains("."))
bookmark = bookmark.Substring(0, bookmark.LastIndexOf("."));
}
BookmarkName newName = Interaction.InputBox(resources.GetString("SetBookmark.Prompt"), resources.GetString("SetBookmark.Title"), bookmark);
if (newName != "")
{
if (FileListBox.SelectedItem is BookmarkName)
FileListBox.Items[FileListBox.SelectedIndex] = newName;
else
{
FileListBox.Items.Insert(FileListBox.SelectedIndex, newName);
BookmarkCounter++;
}
}
}
3.定義頁碼范圍
沒有定義頁碼范圍表示整個PDF進行合并。定義了頁面范圍,合并時只提取相應的頁面進行合并。
頁碼范圍的格式與常見的打印功能的頁碼定義相一致,如:1,2,3,6-9。
這個操作放在右鍵彈出菜單中實現。
private void mnuSetPageRange_Click(object sender, EventArgs e)
{
PdfInfo item = ((PdfInfo)FileListBox.SelectedItem);
string range = Interaction.InputBox(resources.GetString("SetPageRange.Prompt"), resources.GetString("SetPageRange.Title"), item.Ranges);
if (range != item.Ranges)
{
if (range == "")
{
((PdfInfo)FileListBox.Items[FileListBox.SelectedIndex]).Ranges = "";
return;
}
string[] arr = range.Replace(",", ",").Replace(" ", "").Split(',');
range = "";
for (int i = 0; i < arr.Length; i++)
{
if ("" == arr[i]) continue;
if (Regex.IsMatch(arr[i], @"^\d+$") || Regex.IsMatch(arr[i], @"^\d+-\d+$"))
range += ("" == range ? "" : ",") + arr[i];
else
{
MessageBox.Show(resources.GetString("Error.RangeValid"));
return;
}
}
((PdfInfo)FileListBox.Items[FileListBox.SelectedIndex]).Ranges = range;
UpdateUI();
}
}
4.自定義顯示
為了在ListBox中顯示書簽、總頁數和提取頁碼范圍,需要接管ListBox的繪制事件。
private void FileListBox_DrawItem(object sender, DrawItemEventArgs e){
...
StringFormat Formater = new StringFormat();
Formater.Alignment = StringAlignment.Near;
Formater.LineAlignment = StringAlignment.Center;
Formater.Trimming = StringTrimming.EllipsisPath;
Formater.FormatFlags = StringFormatFlags.NoWrap;
if (FileListBox.Items[e.Index] is BookmarkName)
{
e.Graphics.DrawImage(addBookmarkButton.Image, e.Bounds.X, e.Bounds.Y + ((e.Bounds.Height - addBookmarkButton.Image.Height) /2));
e.Graphics.DrawString((BookmarkName)FileListBox.Items[e.Index], e.Font, Brushes.Black
, new Rectangle(e.Bounds.X + addBookmarkButton.Image.Width, e.Bounds.Y, e.Bounds.Width - RIGHT_MARGIN, e.Bounds.Height), Formater);
return;
}
PdfInfo item = (PdfInfo)FileListBox.Items[e.Index];
e.Graphics.DrawString(showNameButton.Checked ? item.Fullname : item.Filename, e.Font, Brushes.Black
, new Rectangle(e.Bounds.X + (BookmarkCounter > 0 ? (int)(addBookmarkButton.Image.Width * 1.5) : 0), e.Bounds.Y, e.Bounds.Width - RIGHT_MARGIN, e.Bounds.Height), Formater);
Formater.Alignment = StringAlignment.Far;
e.Graphics.DrawString((item.Ranges == "" ? "" : item.Ranges + " | ")
+ string.Format(item.TotalPages>1 ? resources.GetString("Pages"): resources.GetString("Page"), item.TotalPages)
, e.Font, Brushes.Gray, e.Bounds, Formater);
}
5.定義頁面尺寸
默認是原始尺寸(不做調整),可根據需要選擇為A4、A5、B4。
private void OnPageSizeChanged(object sender, EventArgs e){
PageSizeButton.Tag = ((ToolStripMenuItem)sender).Tag;
mnuPageSize_Original.Checked = sender == mnuPageSize_Original;
mnuPageSize_A4.Checked = sender == mnuPageSize_A4;
mnuPageSize_A5.Checked = sender == mnuPageSize_A5;
mnuPageSize_B4.Checked = sender == mnuPageSize_B4;
if (mnuPageSize_Original.Checked)
PageSizeButton.Text = resources.GetString("PageSizeButton.Text");
else
PageSizeButton.Text = resources.GetString("PageSizeButton.Text") + ":" + ((ToolStripMenuItem)sender).Text;
}
6.PDF批量合并
這個比較長,有興趣的可以到https://github.com/kacarton/PDFBinder2下載源碼自己看,以下摘錄核心部分。
private void combineButton_Click(object sender, EventArgs e){
if (saveFileDialog.ShowDialog() == DialogResult.OK)
{
using (var combiner = new Combiner(saveFileDialog.FileName, (PDFBinder.PageSize)PageSizeButton.Tag))
{
progressBar.Visible = true;
this.Enabled = false;
for (int i = 0; i < FileListBox.Items.Count; i++)
{
if (FileListBox.Items[i] is BookmarkName)
combiner.AddBookmark((string)FileListBox.Items[i]);
else
combiner.AddFile(((PdfInfo)FileListBox.Items[i]).Fullname, ((PdfInfo)FileListBox.Items[i]).Ranges);
progressBar.Value = (int)(((i + 1) / (double)FileListBox.Items.Count) * 100);
}
this.Enabled = true;
progressBar.Visible = false;
}
System.Diagnostics.Process.Start(saveFileDialog.FileName);
}
}
class Combiner : IDisposable{
public void AddFile(string fileName, string range)
{
var reader = new PdfReader(fileName);
....
_document.NewPage();
if (!string.IsNullOrEmpty(this.BookMarkName))
{
Chapter _chapter = new Chapter("", 1);
_chapter.BookmarkTitle = this.BookMarkName;
_chapter.BookmarkOpen = true;
_document.Add(_chapter);
this.BookMarkName = null;
}
if (_newPageSize == PageSize.Original)
{
var page = _pdfCopy.GetImportedPage(reader, i);
_pdfCopy.AddPage(page);
}
else
{
var page = _writer.GetImportedPage(reader, i);
_document.Add(iTextSharp.text.Image.GetInstance(page));
}
reader.Close();
}
}
7.其他
UI同步、文件移除、上移、下移、排序、多語言支持這些比較簡單就不展開了。
四、代碼開源
源碼已發布在github上,網址:PDFBinder2 https://github.com/kacarton/PDFBinder2,歡迎交流。