.Net使用XML读取word的标题和正文
要获得Word标题,首先要知道标题和正文在word中的节点、节点的关联关系和关联键。
在Word中,标题为[heading1] [heading2]……。[heading9]或[标题1] [标题2]……。[标题9]。
在Docment文件中,在关联w:pStyle w:val='1'/' 1 '中找到w : style w : type=' paragraph ' w : styleid=' docment
图S1-1
Docmetn节点属性,如图D1-2所示
图D1-2
标题导入示例代码如下:
string filename=@ ' hello word . docx ';
using(wordprocessingdocument wd=word(文件名,word))
{
varmain docx=wd . addmaindocumentpart();
var docx=new Documen();
MainDocx。Document=docx
var body=main docx . document . appendchild(new documen());
foreach(open XML element open XML element in body . child elements)
{
//1。首先导入domcument.xml文件
//2。获取与段落和样式相关联的主键
var pprid list=o;paragraph properties();
//3。导入文件
//4。重复执行节点w : style w : type=' paragraph ' w : styleid=' 1 ',并比较pprIdList。
5.如果匹配,则在中获取w 3360 name w : val=' heading 1 '/或w : name w : val=' title 1 '/时获取标题。SytleId(节点)=pStyle(docment.xml节点)
//6。判断为非空,获取当前文本标题文本
Var文本列表=;Text()。ToList();
vartext value list=(x=x . inner text);
}
}
获取正文代码示例
string filename=@ ' hello word . docx ';
using(wordprocessingdocument wd=word(文件名,word))
{
varmain docx=wd . addmaindocumentpart();
var docx=new Documen();
MainDocx。Document=docx
var body=main docx . document . appendchild(new documen());
foreach(open XML element open XML element in body . child elements)
{
//1。首先导入domcument.xml文件
//2。获取与段落和样式相关联的主键
var pprid list=o;paragraph properties();
//3。导入文件
//4。重复执行节点w : style w : type=' paragraph ' w : styleid=' 1 ',并比较pprIdList。SytleId(节点)=pStyle(docment.xml节点)
5.如果匹配,导入获得的w 3360 name w : val=' heading 1 '/或w : name w : val=' style 1 '/,获得title的是sytleId(节点)=p style
//7。如果与标题不匹配且openXmlElement is not Table,则当前段落元素为正文
//8。返回正文文本
Var文本列表=;Text()。ToList();
vartext value list=(x=x . inner text);
}
}
1.《【word怎么识别数字标题】Word系列的快速阅读标题和正文》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《【word怎么识别数字标题】Word系列的快速阅读标题和正文》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/keji/2561128.html