火车头太高级了0级采集链接无法进行
火车头这么高级啊,只要是疑难的网址都能采集到。可是昨天碰到一个超级简单的网址,用火车头却无法采集了!!!!
这个网站的内容页面地址是这样的:
www.xxxx.com/(*).htm
(*)是从1到50000,
只要顺着1.htm到50000.htm采集下来就行了,突然发现火车头竟然采集不了这样的网址。
火车头的采集规矩是你必须要让我分析列表页面,然后我再分析出内容页面的地址,最后我再去采集。
这好比中国功夫一样,你要按照我的套路来打,我才能使出少林功夫来,你要是用西洋拳击来打,我中国功夫就昏倒了,哈
[ 本帖最后由 cofcn 于 2007-11-9 10:03 编辑 ] 自己写一个列表页,让火车采集你这个列表页:lol 怎么不可以?
方法:
使用0级网址
批量添加
www.xxxx.com/(*).htm
(*)是从1到50000, 火车说的对,应该是楼主方法不对! 0级 ,楼没有好好用哈ali15ls 奇怪,0级总死机, 你一下搞的太多了 0级一下子是2000个,还多?? 我采一个论坛将近1万条链接地址(2万左右的数据)。一点开始,火车头看上去好象立马死掉了(我也是这样认为),试了几次,最后不管它了,一点采集就走人,到第二天再来看火车头,嘿嘿,火车头在好好的工作着呢。采下来的数据(两夜一天的时间),乖乖,将近1个GB的access。。。暴汗。 你才一万多,我这个将近150万,!!!!
谁能帮我做个150链接地址的列表啊,怎么做呢??
文章地址页面很简单:www.ssss.com/(*).html
(*)从1到150万
页:
[1]
2