一段python编码,解决html代码转换问题

采集某网页需要的一段python编码,解决html代码转换问题,搞了一个下午,原来又是个好简单的问题

def unescape_word(s):
words = re.findall(“&#(\d+);”, s)

if words:
result=s
for r in words:
word =unichr(int(r))
result = result.replace(“&#%s;” % r,word)
else:
result = s
return result

这样使用:

m1=’ACA 面包机MB-600(黄色)’
print unescape_word(m1)

关于无聊人

一个无聊人而已
此条目发表在python分类目录。将固定链接加入收藏夹。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注