Skip to content
yangfan edited this page May 24, 2023 · 7 revisions

Berry.Docx 是一款基于 OpenXML SDK 开发的用于读写 Word 2007+ (.docx) 文档的 .NET 库。从 Microsoft Office 2007 开始,其采用了一种叫做 Office Open XML 的文件格式,并以 .docx 作为 Word 文件的扩展名。在了解该文件格式后,我们可以知道,文件的实际类型为ZIP,也就是压缩包,压缩包中包含 XML 文件和媒体文件。 该文件格式规范的详细介绍可以在 https://learn.microsoft.com/zh-cn/office/open-xml/open-xml-sdk 中查看。

在 Berry.Docx 中,设计了一系列用于读写 Word 文档的类型,这些类型的结构如下图所示:

其中, Berry.Docx.Document 类表示 Word 文档。通过此类可以新建或加载 Word 文档,进而读写文档的内容和格式。

Berry.Docx.Section 类表示文档中的节。在 Word 中,节是通过在段落中插入分节符进行划分的,分节符前后的内容所属不同的节。通过分节,可以对不同的内容进行分页,并且对该节的内容设置不同的页面布局和页眉页脚等。文档中至少有一个节。

Berry.Docx.Documents.Paragraph 类表示段落。段落是文档中最基本的单元,段落中可以包含文本、图形、域、公式和超链接等内容。

Berry.Docx.Documents.Table 类表示表格。表格由 Berry.Docx.Documents.TableRow (表格行) 组成,表格行由 Berry.Docx.Documents.TableCell (单元格) 组成。单元格包含若干个段落。

Berry.Docx.Documents.SdtBlock 类表示结构化文档标签。一般为文档部件或目录。

Berry.Docx.Documents.HeaderFooter 类表示页眉或页脚。页眉页脚由段落组成,有首页和奇偶之分。

Berry.Docx.Field.BookmarkStartBerry.Docx.Field.BookmarkEnd 类分别表示书签的起始和结束标记。通过书签对内容进行标记后,我们可以使用超链接或域对该块内容进行引用或跳转到此处。

Clone this wiki locally