采集不到页面里的网址（打开过的可以识别到）

meiliba5845 发表于 2012-6-7 14:48:48

这个网站（http://iask.games.sina.com.cn/search_engine/search_knowledge_engine.php?key=%B5%E7%D3%B0&x=0&y=0&tag=0&title=&classid=0&type=0&gjss=0&page=0）的页面地址都可以找到，但是，每个页面里的网址火车头识别不到，这是怎么回事呀？

还有个有趣的问题，只要我打开过的页面地址，火车头可以识别到，没打开过的就识别不出来

kuhabe 发表于 2012-6-7 15:10:02

这个是你写的规则问题吧

meiliba5845 发表于 2012-6-8 13:55:34

有没有人知道怎么弄呀

meiliba5845 发表于 2012-6-12 08:57:21

咋就没人回答呢:Q

lxy2010 发表于 2012-6-12 09:11:20

meiliba5845 发表于 2012-6-12 08:57 static/image/common/back.gif
咋就没人回答呢

这个网站是有防采集的，需要先输入验证码，然后才可以访问的

meiliba5845 发表于 2012-6-12 10:09:11

不是每次打开都要验证码的，我试过，

还有个有趣的问题，只要我打开过的页面地址，火车头可以识别到，没打开过的就识别不出来

meiliba5845 发表于 2012-6-8 08:16:28

不是，这是一个正常的网址，我没有修改过，

页: [1]

火车采集器软件交流官方论坛's Archiver

采集不到页面里的网址（打开过的可以识别到）