dotnet OpenXML 为什么资源使用 Relationship 引用

在 OpenXML 文档格式里面,所有的资源以及页面之间的引用等,都是通过 Relationship 的引用,如资源需要通过 GetReferenceRelationship 的方法才能拿到。那为什么要这样设计呢

在做 Office 解析,可以看到资源的引用,如图片的引用等,不是应用相对的文件路径,而是使用 r:id="xx" 的方式引用,而实际的引用文件需要在 xx.rels 文件里面才能找到引用的路径

尽管在 OpenXML SDK 里面这些细节已经被封装好了,只需要通过 GetReferenceRelationship 方法就可以拿到对应的资源,但我好奇为什么 Office 这样设计

Office 文档解析 文档格式和协议 我和小伙伴讲了 Office 文档的格式,这里存储的方式使用的是 OPC (Open Package Convention) 协议

在 OPC 协议里面要求多个 Part 也就是文件之间不能相互引用,如果两个 Part 有引用,需要在 Part 的 rels 文件里面添加引用,而在 Part 里面只使用对应的 rels 文件的记录资源的 Id 的值

那 Part 的 rels 又是什么?在 OPC 里面规定的 Part 可以理解为文件,因为 OPC 是基于 Zip 的打包方法,而 Zip 里面都是文件。而 rels 其实就是 OPC 里面的 Relationship 概念,这个 Relationship 是一种特殊的 Part 文件,它描述了各 Part 之间的依赖关系。根据OPC协议的规定,所有的 Relationship 都必须存储在名为 _rels 的文件夹中,并且所有 Relationship 的文件名都必须以 .rels 为后缀。每个 Part 可以根据自身的业务需求有一个对应的 Relationship 文件,这个对应的 Relationship 文件必须存放在这个 Part 文件所在文件夹的 _rels 文件夹里面,同时要求使用 Part 文件加上 .rels 后缀,不能使用其他名字

如某个 PPT 页面 slide1.xml 引用了某个音频文件,那么这个页面不能直接写音频文件的相对路径,而是需要在 slide1.xml 所在文件夹新建一个 _rels 文件夹,在里面放一个 slide1.xml.rels 文件,如下

ppt\slides\slide1.xml
ppt\slides\_rels\slide1.xml.rels

按照 OPC 的定义,在 Relationship 里面定义引用,假设音频文件存放在 ppt\media\image1.png 文件,那么对应的对应的 slide1.xml.rels 文件内容可以如下

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<Relationships xmlns="http://schemas.openxmlformats.org/package/2006/relationships">
  <Relationship Id="rId1" Type="http://schemas.openxmlformats.org/officeDocument/2006/relationships/image" Target="../media/image1.png"/>
</Relationships>

使用 Relationship 定义 Id 的值,用来给 slide1.xml 引用,同时配置资源类型,通过 Type 定义,最后使用 Target 属性引用文件

此时在 slide1.xml 就可以根据 Id 引用资源,如以下代码

<a:blip r:embed="rId1"/>

此时通过 rId1 就可以在 slide1.xml.rels 找到对应的资源,然后通过资源的相对路径拿到文件

在 OpenXML SDK 里面将这部分都封装了,不需要咱自己去找对应的文件,通过 GetPartById 或 GetReferenceRelationship 传入资源的 Id 就可以拿到对应的资源。在 OPC 里面的定义,可以知道使用 Part 表示文件等。因此 GetReferenceRelationship 返回的是 ReferenceRelationship 类,根据对象转换为 DataPartReferenceRelationship 或 ExternalRelationship 等

在 2.11 版本的 DocumentFormat.OpenXml 库里面添加了我的代码,可以使用 TryGetPartById 方法在 OpenXmlPartContainer 尝试获取资源。因为默认的 GetPartById 将会在找不到资源的时候抛出 ArgumentOutOfRangeException 而如果文档是用户创建的,也许他用的是 WPS 等软件做的文档不遵守标准,此时就会炸了

                if (Slide.SlidePart.TryGetPartById(id, out var part))
                {
                }

那为什么只有 GetPartById 添加了 TryGetPartById 方法,而 GetReferenceRelationship 没有?在获取不到资源的时候,会在 GetReferenceRelationship 里面抛出 KeyNotFoundException 提示

原因是使用 GetReferenceRelationship 时,一般都可以确定 Id 是否存在,因为有 HyperlinkRelationships 和 DataPartReferenceRelationships 等属性的存在,可以通过这些属性进行判断

关于 Relationship 的一个应用请看 C# dotnet 使用 OpenXml 解析 PPT 里面的视频

更多请看 Office 使用 OpenXML SDK 解析文档博客目录

我搭建了自己的博客 https://blog.lindexi.com/ 欢迎大家访问,里面有很多新的博客。只有在我看到博客写成熟之后才会放在csdn或博客园,但是一旦发布了就不再更新

如果在博客看到有任何不懂的,欢迎交流,我搭建了 dotnet 职业技术学院 欢迎大家加入

如有不方便在博客评论的问题,可以加我 QQ 2844808902 交流

知识共享许可协议
本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。欢迎转载、使用、重新发布,但务必保留文章署名林德熙(包含链接:http://blog.csdn.net/lindexi_gd ),不得用于商业目的,基于本文修改后的作品务必以相同的许可发布。如有任何疑问,请与我联系。

lindexi_gd CSDN认证博客专家 C# WPF UWP 微软最具价值专家
我是微软Windows应用开发方向的最具价值专家,欢迎访问我博客blog.lindexi.com里面有大量WPF和UWP博客
已标记关键词 清除标记
【为什么还需要学习C++?】 你是否接触很多语言,但从来没有了解过编程语言的本质? 你是否想成为一名资深开发人员,想开发别人做不了的高性能程序? 你是否经常想要窥探大型企业级开发工程的思路,但苦于没有基础只能望洋兴叹?   那么C++就是你个人能力提升,职业之路进阶的不二之选。 【课程特色】 1.课程共19大章节,239课时内容,涵盖数据结构、函数、类、指针、标准库全部知识体系。 2.带你从知识与思想的层面从0构建C++知识框架,分析大型项目实践思路,为你打下坚实的基础。 3.李宁老师结合4大国外顶级C++著作的精华为大家推出的《征服C++11》课程。 【学完后我将达到什么水平?】 1.对C++的各个知识能够熟练配置、开发、部署; 2.吊打一切关于C++的笔试面试题; 3.面向物联网的“嵌入式”和面向大型化的“分布式”开发,掌握职业钥匙,把握行业先机。 【面向人群】 1.希望一站式快速入门的C++初学者; 2.希望快速学习 C++、掌握编程要义、修炼内功的开发者; 3.有志于挑战更高级的开发项目,成为资深开发的工程师。 【课程设计】 本课程包含3大模块 基础篇 本篇主要讲解c++的基础概念,包含数据类型、运算符等基本语法,数组、指针、字符串等基本词法,循环、函数、类等基本句法等。 进阶篇 本篇主要讲解编程中常用的一些技能,包含类的高级技术、类的继承、编译链接和命名空间等。 提升篇: 本篇可以帮助学员更加高效的进行c++开发,其中包含类型转换、文件操作、异常处理、代码重用等内容。
©️2020 CSDN 皮肤主题: 终极编程指南 设计师:CSDN官方博客 返回首页