whoamixx 发表于 2013-7-24 10:41:24

火车头无法获取url地址为反斜杠“\”的url地址

火车头会自动过滤反斜杠“\”为空。。没办法正常采集 另附一个我详细说明的帖子

http://bbs.locoy.com/spider-134534-1-1.html

caijihome 发表于 2013-7-24 11:02:23

官方说过了,你这个网址是错误的。
http://bbs.locoy.com/spider-132436-1-1.html

whoamixx 发表于 2013-7-24 11:18:03

额。。 但是有的网站url规则就是这么做的。。如果加个替换功能多好。。 什么都解决了。楼上的这个问题解决了吗

303718 发表于 2013-7-24 11:28:15

用自定义链接呢

whoamixx 发表于 2013-7-24 11:36:14

303718 发表于 2013-7-24 11:28 static/image/common/back.gif
用自定义链接呢

你看我上边的那个帖子了么 http://bbs.locoy.com/spider-134534-1-1.html   能获取也能采集 但是内容页的分页获取自动获取会出错 所以没办法采集内容分页

whoamixx 发表于 2013-7-25 14:21:09

303718 发表于 2013-7-24 11:28 static/image/common/back.gif
用自定义链接呢

额明白了...原来我一直钻牛角尖 其实火车头手动获取规则完全能当作替换功能来用。 可以用多个参数拼凑。。

caijihome 发表于 2013-7-26 00:04:49

whoamixx 发表于 2013-7-25 14:21 static/image/common/back.gif
额明白了...原来我一直钻牛角尖 其实火车头手动获取规则完全能当作替换功能来用。 可以用多个参数拼凑 ...

你看看我那个能拼凑不。能拼凑是巧合!这个问题我自己用的话,PHP插件处理
页: [1]
查看完整版本: 火车头无法获取url地址为反斜杠“\”的url地址