scugzd 发表于 2011-11-17 17:15:10

无根目录标识"/",无法正确采集网址

采集网址深度为1,需要采集目标页面的地址,目标页面的地址为以下的类型:
<a href="1234.html" title="1234">

就采集不了地址。

一般的地址都是<a href="http://www.123.com/1234.html">或者a href="/1234.html">,都能采集。

可是这个地址确实没有根路径的"/",火车头就不能识别了。

求高手指点!

303718 发表于 2011-11-17 17:18:25

你好,这个用自定义链接<a href="[参数]"

scugzd 发表于 2011-11-17 18:35:11

我试了:

脚本规则:<p><a href="[参数]" title="(*)">
实际链接:http://www.123.com/[参数1]

还是没有,好奇怪!
页: [1]
查看完整版本: 无根目录标识"/",无法正确采集网址