lighterjoul 发表于 2013-12-4 13:39:44

如何采集动态变动的数据,请各位指教

大家好,请教一下,同一个地址,每次请求返回的源码是不一样的,这些规则要如何做呢?

比如要采集一张图片,同一个网址返回的源码可能有以下几种:
1) <div id='abc'><img src='test.jpg'/></div>
2) <div style='xxx'><img src='test.jpg'/></div>
3) javascript方式去展现这个图片,如image.src='test.jpg'

有没有一种方式,将这三种情况都囊括下去,比如第一种为空的话,用第二种匹配等等。新手,还请各位大侠指教。。

303718 发表于 2013-12-4 21:51:53

src='test.jpg'那这个就相同了呢.用这个采

lighterjoul 发表于 2013-12-4 22:24:26

303718 发表于 2013-12-4 21:51 static/image/common/back.gif
src='test.jpg'那这个就相同了呢.用这个采

src只是一个例子而已,比如js里面可能会有data='test.jpg'

303718 发表于 2013-12-4 22:42:52

每种建一个标签来采集就行

lighterjoul 发表于 2013-12-5 12:15:16

303718 发表于 2013-12-4 22:42 static/image/common/back.gif
每种建一个标签来采集就行

多谢,但发布的话就比较麻烦了,比如建3个image标签, image1,image2,image3,相对一个请求而言,这三个标签中只有一个是有内容的,其他两个都是空值,这样发布模块就不知道用哪个为好了。之前考虑过标签组合,但免费版不支持,可惜了。

不知道大哥有没有更好的发布策略?多谢~
页: [1]
查看完整版本: 如何采集动态变动的数据,请各位指教