meiliba5845 发表于 2012-6-7 14:48:48

采集不到页面里的网址(打开过的可以识别到)


这个网站(http://iask.games.sina.com.cn/search_engine/search_knowledge_engine.php?key=%B5%E7%D3%B0&x=0&y=0&tag=0&title=&classid=0&type=0&gjss=0&page=0)的页面地址都可以找到,但是,每个页面里的网址火车头识别不到,这是怎么回事呀?

还有个有趣的问题,只要我打开过的页面地址,火车头可以识别到,没打开过的就识别不出来

kuhabe 发表于 2012-6-7 15:10:02

这个是你写的规则问题吧

meiliba5845 发表于 2012-6-8 13:55:34

有没有人知道怎么弄呀

meiliba5845 发表于 2012-6-12 08:57:21

咋就没人回答呢:Q

lxy2010 发表于 2012-6-12 09:11:20

meiliba5845 发表于 2012-6-12 08:57 static/image/common/back.gif
咋就没人回答呢

这个网站是有防采集的,需要先输入验证码,然后才可以访问的

meiliba5845 发表于 2012-6-12 10:09:11

不是每次打开都要验证码的,我试过,


还有个有趣的问题,只要我打开过的页面地址,火车头可以识别到,没打开过的就识别不出来

meiliba5845 发表于 2012-6-8 08:16:28

不是,这是一个正常的网址,我没有修改过,
页: [1]
查看完整版本: 采集不到页面里的网址(打开过的可以识别到)