ck032 发表于 2012-2-29 11:53:28

网址采集


这样的网址怎么采集呢?

http://hotel.qunar.com/city/sanya/dt-3798

变化的有两处:1.sanya 2.数值3798

网址采集规则怎么写?

谢谢!

303718 发表于 2012-2-29 12:39:03

以这里为采集列表采集
http://hotel.qunar.com/city/sanya/#from=l-breadcrumbs

ck032 发表于 2012-2-29 13:30:21

麻烦你说一下具体操作呵!
我刚刚开始用火车头,很多不明白。
谢谢!{:soso_e181:}

ddzz001 发表于 2012-2-29 13:35:45

学习了{:soso_e100:}{:soso_e102:}{:soso_e103:}

ck032 发表于 2012-2-29 14:27:32

再顶顶 希望帮助下 我试了半天了 没试出来

caziyo 发表于 2012-2-29 14:49:31

使用2010版的网址生成工具 然后再7。0中导入文本

ck032 发表于 2012-2-29 15:12:03

最好能截图说明下

ck032 发表于 2012-2-29 15:40:07

我利用的是正则提取采集网址。
源地址用的是303718说的:http://hotel.qunar.com/city/sanya/#from=l-breadcrumbs
设置源代码:从</script> 到 <div class="qn_footer">
脚本规则:<li><a href="[参数]/">
实际连接:http://hotel.qunar.com/city/[参数1]

这样的话是可以提取一个页面上的网址,但是只有几条;并且都是sanya的;
还是没法实现地址和数值两处的变化。不知道怎么继续做下去了。

ck032 发表于 2012-2-29 17:00:32

请各位帮帮忙!谢谢!

sss 发表于 2012-2-29 19:56:21

多个地方就添加多个采集规则,要么用插件处理网址
页: [1]
查看完整版本: 网址采集