火车头无法获取url地址为反斜杠“\”的url地址
火车头会自动过滤反斜杠“\”为空。。没办法正常采集 另附一个我详细说明的帖子http://bbs.locoy.com/spider-134534-1-1.html 官方说过了,你这个网址是错误的。
http://bbs.locoy.com/spider-132436-1-1.html 额。。 但是有的网站url规则就是这么做的。。如果加个替换功能多好。。 什么都解决了。楼上的这个问题解决了吗 用自定义链接呢 303718 发表于 2013-7-24 11:28 static/image/common/back.gif
用自定义链接呢
你看我上边的那个帖子了么 http://bbs.locoy.com/spider-134534-1-1.html 能获取也能采集 但是内容页的分页获取自动获取会出错 所以没办法采集内容分页 303718 发表于 2013-7-24 11:28 static/image/common/back.gif
用自定义链接呢
额明白了...原来我一直钻牛角尖 其实火车头手动获取规则完全能当作替换功能来用。 可以用多个参数拼凑。。 whoamixx 发表于 2013-7-25 14:21 static/image/common/back.gif
额明白了...原来我一直钻牛角尖 其实火车头手动获取规则完全能当作替换功能来用。 可以用多个参数拼凑 ...
你看看我那个能拼凑不。能拼凑是巧合!这个问题我自己用的话,PHP插件处理
页:
[1]