如何使用 XPath 从 HTML 文档中提取标签文本并过滤掉特定子标签？

一分耕耘，一分收获！既然都打开这篇，就坚持看下去，学下去吧！本文主要会给大家讲到等等知识点，如果大家对本文有好的建议或者看到有不足之处，非常欢迎大家积极提出！在后续文章我会继续更新文章相关的内容，希望对大家都有所帮助！

获取标签文本并过滤子标签

如何使用 xpath 从 html 文档中提取标签文本，同时过滤掉其包含的特定子标签？

问题

对于 html 片段：

<div>
<p>
<a>123</a>
这是要获取的文本
</p>
</div>

目标是获取 <p> 标签的文本内容，同时过滤掉 <a> 标签。

尝试过的解决方案

用户尝试了以下 xpath 表达式，但均无法达到预期效果：

解决方案

li.xpath('p')[0].xpath('string(.)')

此 xpath 表达式：

这将返回这是要获取的文本，过滤掉 123 文本（位于 <a> 标签内）。

以上就是《如何使用 XPath 从 HTML 文档中提取标签文本并过滤掉特定子标签？》的详细内容，更多关于的资料请关注公众号！

近期文章