采集不到页面里的网址(打开过的可以识别到)
这个网站(http://iask.games.sina.com.cn/search_engine/search_knowledge_engine.php?key=%B5%E7%D3%B0&x=0&y=0&tag=0&title=&classid=0&type=0&gjss=0&page=0)的页面地址都可以找到,但是,每个页面里的网址火车头识别不到,这是怎么回事呀?
还有个有趣的问题,只要我打开过的页面地址,火车头可以识别到,没打开过的就识别不出来
这个是你写的规则问题吧 有没有人知道怎么弄呀 咋就没人回答呢:Q meiliba5845 发表于 2012-6-12 08:57 static/image/common/back.gif
咋就没人回答呢
这个网站是有防采集的,需要先输入验证码,然后才可以访问的
不是每次打开都要验证码的,我试过,
还有个有趣的问题,只要我打开过的页面地址,火车头可以识别到,没打开过的就识别不出来 不是,这是一个正常的网址,我没有修改过,
页:
[1]