lua获取网页链接的代码记录

lua获取网页链接的代码记录, 今天完成的,这次没有用lua的htmlparser模块,因为它是lua2.0才能用的,所以这次用了lua的正则.

其实语言的都是用它们的html解释模块做的,但这次只好自己来,所以又要研究一下lua的正则。

以下是代码:

http=require("socket.http")


function getlink(strstr)
   ff={}
   i=1
   for w,v in string.gmatch(strstr, '<a([^>]-)href=[\"|\']([^\"\']-)[\"|\']([^>]-)>') do
      --print(w)
      ff[i]=v
      i=i+1
   end 
   return ff
end

result=http.request("https://www.lpfrx.com")
--ss='46456456546zzzz<a id="current" href="http://www.zsqx.com:80/weather">546456456<a href=http://www.zsqx.com:81/abc>546456456'
gg=getlink(result)
print(#gg)
print(gg[1])

for j=1,#gg do

   print(gg[j])
end


--星号(*)和横线(-)的主要差别是,星号总是试图匹配更多的字符,而横线则总是试图匹配最少的字符

又是用爬虫的例子学习lua语言编程.

不过说实话,现在都是习惯用python语言来解决问题,因为用得太顺手了,在不追求性能和速度上的话,python解决问题快,lua编程也要学点,反正慢慢学吧,学这个也是为了在openwrt用lua操作, 反正学多一点不坏.

关于无聊人

一个无聊人而已
此条目发表在技术生活分类目录。将固定链接加入收藏夹。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注