如何用正则表达式同时采集多页面?
本帖最后由 sylvia 于 2011-9-5 18:30 编辑我所采的默认网页是:http://e.cantonfair.org.cn/cn/eshop/Index.asp?CID=27014093
若要采集点击 后转到的页面里面的内容,应该在内如何配置?
目的是在同时采集多页面配置时,用正则表达式将首页网址: http://e.cantonfair.org.cn/cn/eshop/Index.asp?CID=27014093
替换成目的页面的网址 : http://e.cantonfair.org.cn/cn/eshop/Intro.asp?CID=27014093
用第一种方法如何配置?
请各位高手指教啊~~!! 本帖最后由 wxl08 于 2011-9-6 09:20 编辑
http://e.cantonfair.org.cn/cn/eshop/Index.asp\?CID=(\d+)替换为
http://e.cantonfair.org.cn/cn/eshop/Intro.asp?CID=$1 回复 2# wxl08
谢谢你回复的第一步,那如果接下来两页面模板不一样,想把其内容合并,该如何操作?谢谢! 学好正则确实很重要
页:
[1]