文章内容页地址替换问题.
我采集到的文章内容页页地址例如为:http://www.xxx.cn/literature/open.php?id=12但他实际的页面内容显示地址为:http://www.xxx.cn/view.php?id=12
如何将采集到的文章内容页列表地址替换为下面的呢?不然采集内容就采集不到了.... 地址? 例如采集列表地址:http://www.xxx.cn/literature/more.php?mmm=(*)&ttt=1
采集得到的内容页列表为:http://www.xxx.cn/literature/open.php?id=12
http://www.xxx.cn/literature/open.php?id=13
....
但他内容页实际的显示为:http://www.xxx.cn/view.php?id=12
我怎么把采集到的http://www.xxx.cn/literature/open.php?id=12中的literature/open替换为vies呢?不然我采集不到具体的文章内容啊,找遍了 没找到替换功能,supesite采集器里有这样替换功能 这个是可以办到的,火车可以替换的 本帖最后由 zydxdx 于 2009-3-23 13:54 编辑
手动填写连接规则就可以了 谢谢各位的帮助,楼上的 我按照你那样填写了 不过连列表地址都采集不到了... 5楼 说的可以你可以再看看 是不是有地方搞错了 能在说详细点吗?我的确采集不到啊.
例如采集列表地址:http://www.xxx.cn/literature/more.php?mmm=(*)&ttt=1
这个页面代码里可采集的文章列表地址形式为:
<a href=/literature/open.php?id=10 style="text-decoration: none;" >爱人,你还记得我吗?(二)</a>
那我
采集得到的内容页列表为:http://www.xxx.cn/literature/open.php?id=12
http://www.xxx.cn/literature/open.php?id=13
....
但他内容页实际的显示为:http://www.xxx.cn/view.php?id=12
我怎么把采集到的http://www.xxx.cn/literature/open.php?id=12中的literature/open替换为vies呢?不然我采集不到具体的文章内容啊,找遍了 没找到替换功能,supesite采集器里有这样替换功能
我按照楼上的楼上的兄弟指点 那样自定义 采集得到的列表地址为0,哪位兄弟能再具体指点下. ali68lsali98ls 手动设定采集规则是个附加的设置 自动采集里面还是要设置采集地址啊。。。。
页:
[1]
2