一段python编码,解决html代码转换问题

发表于2011年5月6日由无聊人

采集某网页需要的一段python编码，解决html代码转换问题，搞了一个下午，原来又是个好简单的问题

def unescape_word(s):
words = re.findall(“&#(\d+);”, s)

if words:
result=s
for r in words:
word =unichr(int(r))
result = result.replace(“&#%s;” % r,word)
else:
result = s
return result

这样使用：

m1=’ACA 面包机MB-600（黄色）’
print unescape_word(m1)

关于无聊人

一个无聊人而已

查看由无聊人发表的所有文章 →

此条目发表在python分类目录。将固定链接加入收藏夹。

一段python编码,解决html代码转换问题

关于无聊人

发表回复

AD

友情链接

近期评论

其他操作