39健康网采集规则+科讯7.0web发布模块+修改教程+代写规则
本帖最后由 123456aaa 于 2010-10-22 21:00 编辑这个规则写的是39-减肥-减肥食谱-主食
具体的列表地址是
http://fitness.39.net/jfsp/zs/index.html
主要的难点就是39也用了多模板
用正则写一下就可以正确读取文章内容
(<div class="article">|<div class="art_con" id="contentText">)(?<content>[\s\S]*?)(<div class="page">|<div class="art_page">)
其中(<div class="article">|<div class="art_con" id="contentText">)是内容开始部分,有2种模板,所以要写成这种格式,意思是网页中有<div class="article">或者<div class="art_con" id="contentText">就是内容的开头,(?<content>[\s\S]*?)是火车头内置的文章内容正则表达式,直接用就是了
(<div class="page">|<div class="art_page">)意思是网页中有<div class="page">或者<div class="art_page">就是文章内容的结尾,这样就可以正确读取文章内容了
具体的大家比较一下
http://fitness.39.net/a/20101015/1504815.html
http://fitness.39.net/jfsp/105/7/1266214.html
这两个页面的源代码就知道了,如果你还是不会修改,那就反复看反复的想,我这规则肯定是可以用的,按照我的格式,仔细找不同,绝对搞的定
WEB发布模块应该是通用6.X的,好像科讯后台没重写过,网址那填下你的网址,点下登陆保存COOKIES就行了,点下获取栏目,然后再选择你要发布的栏目,就可以发布了
另外鄙视一下不想卖白菜价的接活的人,用个火车头很高级的技术?我下午5点开始研究,7点成功发布1700个文章,过去从没用过火车头.本来想的是反正接的是仿站的活,花点小钱直接买个规则来就完事了,结果100还不卖,现成的规则,又不让你重写新的,还问我仿站多少钱,我仿站3000,咋了,还想分点?
代写规则 难度随意 100元,0基础保教会,如果栏目多,自己又不想动手写的,适当加钱,我全搞定,包售后。
忘记留QQ了 397234392 多年网络接活选手,技术一流,收费三流
顶你,好东西ali81ls 也许是我人品问题,连网址都采不到 本帖最后由 buyetian 于 2010-11-18 16:35 编辑
搞定了,网址深度改为2,添加了列表页页面选定区域,采集帖子我看采集成功了,未作修改。采集还是蛮简单的。
能写出收费版本功能的规则才叫牛。 我怎么打不开文件
不知道怎么个情况 我采集了只有20几个文章我搞了下 现在可以了 大家试试吧 dddddddddddddddd wwwwwwwwwwwwwwwwwwwwwwwwwwww 得顶共享精神ddddddddddddddddddd
页:
[1]