sylvia 发表于 2011-9-5 18:25:58

如何用正则表达式同时采集多页面?

本帖最后由 sylvia 于 2011-9-5 18:30 编辑

我所采的默认网页是:http://e.cantonfair.org.cn/cn/eshop/Index.asp?CID=27014093

若要采集点击 后转到的页面里面的内容,应该在内如何配置?

目的是在同时采集多页面配置时,用正则表达式将首页网址: http://e.cantonfair.org.cn/cn/eshop/Index.asp?CID=27014093
替换成目的页面的网址 : http://e.cantonfair.org.cn/cn/eshop/Intro.asp?CID=27014093



用第一种方法如何配置?

请各位高手指教啊~~!!

wxl08 发表于 2011-9-6 09:18:39

本帖最后由 wxl08 于 2011-9-6 09:20 编辑

http://e.cantonfair.org.cn/cn/eshop/Index.asp\?CID=(\d+)替换为
http://e.cantonfair.org.cn/cn/eshop/Intro.asp?CID=$1

carlgreat 发表于 2011-10-9 00:24:16

回复 2# wxl08

谢谢你回复的第一步,那如果接下来两页面模板不一样,想把其内容合并,该如何操作?谢谢!

flaven 发表于 2011-10-9 11:05:52

学好正则确实很重要
页: [1]
查看完整版本: 如何用正则表达式同时采集多页面?