lua获取网页链接的代码记录, 今天完成的,这次没有用lua的htmlparser模块,因为它是lua2.0才能用的,所以这次用了lua的正则.
其实语言的都是用它们的html解释模块做的,但这次只好自己来,所以又要研究一下lua的正则。
以下是代码:
http=require("socket.http") function getlink(strstr) ff={} i=1 for w,v in string.gmatch(strstr, '<a([^>]-)href=[\"|\']([^\"\']-)[\"|\']([^>]-)>') do --print(w) ff[i]=v i=i+1 end return ff end result=http.request("https://www.lpfrx.com") --ss='46456456546zzzz<a id="current" href="http://www.zsqx.com:80/weather">546456456<a href=http://www.zsqx.com:81/abc>546456456' gg=getlink(result) print(#gg) print(gg[1]) for j=1,#gg do print(gg[j]) end --星号(*)和横线(-)的主要差别是,星号总是试图匹配更多的字符,而横线则总是试图匹配最少的字符
又是用爬虫的例子学习lua语言编程.
不过说实话,现在都是习惯用python语言来解决问题,因为用得太顺手了,在不追求性能和速度上的话,python解决问题快,lua编程也要学点,反正慢慢学吧,学这个也是为了在openwrt用lua操作, 反正学多一点不坏.