python去除所有html标签的方法

ApiPost团队 后端 2020-04-26

这段代码可以用于去除文本里的字符串标签,不包括标签里面的内容

import re
html='<a  target="_blank" href="https://url.apipost.cn/url?%2F%2Fwww.xxx.com"  rel="external nofollow" >我们</a>,Python学习!'
dr = re.compile(r'<[^>]+>',re.S)
dd = dr.sub('',html)
print(dd)

运行结果如下:

我们,Python学习!

希望本文对大家的Python程序设计有所帮助。

Apipost 私有化火热进行中

评论