56casino 发表于 2009-5-18 18:00:00

火车采集的一点小技巧

开了一段时间的火车,有点小发现,现在和大家分享。
在采集网址规则那里,通常都需要去分析文章列表页面的源代码。其实里面的文章的地址都是有一定规则并和其他不需要的网址区分开来。选取那些需要采集的文章的地址的独特的字符填到“文章内容页面的地址必须包含”后面的框里。再点开始测试网址采集试试看,是不是需要的文章地址已经出来了?
这样就不用去分析原代码了呵呵。
页: [1]
查看完整版本: 火车采集的一点小技巧