如何采集动态变动的数据,请各位指教
大家好,请教一下,同一个地址,每次请求返回的源码是不一样的,这些规则要如何做呢?比如要采集一张图片,同一个网址返回的源码可能有以下几种:
1) <div id='abc'><img src='test.jpg'/></div>
2) <div style='xxx'><img src='test.jpg'/></div>
3) javascript方式去展现这个图片,如image.src='test.jpg'
有没有一种方式,将这三种情况都囊括下去,比如第一种为空的话,用第二种匹配等等。新手,还请各位大侠指教。。 src='test.jpg'那这个就相同了呢.用这个采 303718 发表于 2013-12-4 21:51 static/image/common/back.gif
src='test.jpg'那这个就相同了呢.用这个采
src只是一个例子而已,比如js里面可能会有data='test.jpg' 每种建一个标签来采集就行 303718 发表于 2013-12-4 22:42 static/image/common/back.gif
每种建一个标签来采集就行
多谢,但发布的话就比较麻烦了,比如建3个image标签, image1,image2,image3,相对一个请求而言,这三个标签中只有一个是有内容的,其他两个都是空值,这样发布模块就不知道用哪个为好了。之前考虑过标签组合,但免费版不支持,可惜了。
不知道大哥有没有更好的发布策略?多谢~
页:
[1]