可爱的利物浦赢了
刚醒,凌晨真是一波三折啊,但毕竟可爱的利物浦赢了,哈哈.今天继续美丽的女性网站.对于瑞丽的规则,其他的就不写了,可以说基本相同,刚才测试了下通用性,只有2006年左右的文章由于代码结构不同,会在内容标签内采集到分页数据,但基本无碍.对于瑞丽的采集基本就到此结束,一个规则整站采集在PHPCMS没有推出2008版之前基本不可能,也继续等待火车头的2008.有人可能会说我标题党吧,你标题上写的整站.但说实话,如果你仔细看了前面的帖子,如果还是搞不定采集,那么我在7楼等你的消息,仅仅是更改栏目地址而已.
昨天看了篇帖子关于JS采集的,火车说是没有JS的下载项,更新了DLL文件.对于以后的采集会越发的困难,唉,有时间我也去看看JS,做个防采集,哈哈,来个火车头大碰撞,忽忽,满精彩的.开玩笑了,现在更新dll后,问题应该解决了.
还在看post的东西和JS分页,不会啊,有谁教教我.或者推荐一个是这种的采集规则,我模仿下 ,呵呵 在此召唤版主写教程.
[
本帖最后由 7451 于 2008-4-9 11:10 编辑 ]