milklluu 发表于 2014-5-20 16:59:09

帮顶同迷惑。感觉这个页面里面table 写得看得头疼呀。 网页太老旧 感觉标签有的都不成对。 可是如果采集器是按照文本来搜索的话 不应该找不到呀。

kagebaby 发表于 2014-5-20 23:18:19

milklluu 发表于 2014-5-20 16:59 static/image/common/back.gif
帮顶同迷惑。感觉这个页面里面table 写得看得头疼呀。 网页太老旧 感觉标签有的都不成对。 可是如果采集器 ...

按道理网址规则和内容规则都没什么问题,就是采不到内容,简直是神奇。

a8507024 发表于 2014-5-21 18:18:58

神奇的问题很多啊

kagebaby 发表于 2014-5-21 23:49:21

a8507024 发表于 2014-5-21 18:18 static/image/common/back.gif
神奇的问题很多啊

神奇的是论坛高人如云,但这问题没人知道,也没人能解决。这就是最神奇的

jidongcc 发表于 2014-6-27 10:02:34

我也出现了这个问题,地址可以采集到,测试的时候没有内容,查了查,发现网页登陆信息:CookieUser-Agent写反了

kagebaby 发表于 2014-6-28 14:06:42

怎么个写反了呢?都是截包数据吧

lmj243 发表于 2014-7-21 00:18:10

kagebaby 发表于 2014-6-28 14:06 static/image/common/back.gif
怎么个写反了呢?都是截包数据吧

你们屌炸天了....这个问题都能讨论2页....哥试了下, 火车不换代理连续采集近三百章, 无压力...不明白你们讨论的难点在哪里.....

lmj243 发表于 2014-7-21 00:18:38

lmj243 发表于 2014-7-21 00:18 static/image/common/back.gif
你们屌炸天了....这个问题都能讨论2页....哥试了下, 火车不换代理连续采集近三百章, 无压力...不明白你们 ...

不是论坛无人, 是这样级别的问题没人愿意搭理....

kagebaby 发表于 2014-7-21 10:33:48

本帖最后由 kagebaby 于 2014-7-21 10:35 编辑

lmj243 发表于 2014-7-21 00:18 static/image/common/back.gif
不是论坛无人, 是这样级别的问题没人愿意搭理....

求高人解答,传送门:http://bbs.locoy.com/spider-137639-1-1.html
页: 1 [2]
查看完整版本: 规则为什么采集不到内容,能采集到网址。