茶树虾 发表于 2014-10-28 12:50:04

多级网址如何替换链接?

我现在要采集一个网站,他是这样的结构
http://127.0.0.1/web78/NewsLists.aspx?cid=713
里面是一个ajax分页,然后我抓包提取出来以后是这样的链接
http://127.0.0.1/Ajax/Ajax.aspx?type=1&page=1&cid=713&psize=27&fid=972
这个页面可以采集到列表,但是列表的url是href="News/20140401/3949.htm" 这样的url,也就是打开以后链接会自动变成
http://127.0.0.1/Ajax/News/20140401/3949.htm 这样的链接,但是这不是正确的链接,正确的链接为http://127.0.0.1/web78/News/20140401/3949.htm所以我现在不知道用什么方法才能把把Ajax替换成web78这样的路径

小弟新手,求各位大大指点

采集超市 发表于 2014-10-28 15:19:15

直接做下网址替换就行了,火车头可以实现!










『采集超市』专注于火车头规则、插件、模块、接口等周边产品开发!为企业和个人提供全方位的采集发布方案!
联系QQ: http://www.3464.com/tools/qqonline/Images/QQOnline/6_online.gif
官方网站:www.locoymall.com

http://bbs.locoy.com/data/attachment/forum/201310/21/002539x2g25ntt59yx85xt.gif

茶树虾 发表于 2014-10-28 17:24:20

采集超市 发表于 2014-10-28 15:19 static/image/common/back.gif
直接做下网址替换就行了,火车头可以实现!




请问这个网址替换在哪个功能里面呢?有教程吗?
页: [1]
查看完整版本: 多级网址如何替换链接?