123456aaa 发表于 2010-10-22 20:55:29

39健康网采集规则+科讯7.0web发布模块+修改教程+代写规则

本帖最后由 123456aaa 于 2010-10-22 21:00 编辑

这个规则写的是39-减肥-减肥食谱-主食
具体的列表地址是
http://fitness.39.net/jfsp/zs/index.html

主要的难点就是39也用了多模板
用正则写一下就可以正确读取文章内容
(<div class="article">|<div class="art_con" id="contentText">)(?<content>[\s\S]*?)(<div class="page">|<div class="art_page">)

其中(<div class="article">|<div class="art_con" id="contentText">)是内容开始部分,有2种模板,所以要写成这种格式,意思是网页中有<div class="article">或者<div class="art_con" id="contentText">就是内容的开头,(?<content>[\s\S]*?)是火车头内置的文章内容正则表达式,直接用就是了
(<div class="page">|<div class="art_page">)意思是网页中有<div class="page">或者<div class="art_page">就是文章内容的结尾,这样就可以正确读取文章内容了
具体的大家比较一下
http://fitness.39.net/a/20101015/1504815.html
http://fitness.39.net/jfsp/105/7/1266214.html
这两个页面的源代码就知道了,如果你还是不会修改,那就反复看反复的想,我这规则肯定是可以用的,按照我的格式,仔细找不同,绝对搞的定

WEB发布模块应该是通用6.X的,好像科讯后台没重写过,网址那填下你的网址,点下登陆保存COOKIES就行了,点下获取栏目,然后再选择你要发布的栏目,就可以发布了

另外鄙视一下不想卖白菜价的接活的人,用个火车头很高级的技术?我下午5点开始研究,7点成功发布1700个文章,过去从没用过火车头.本来想的是反正接的是仿站的活,花点小钱直接买个规则来就完事了,结果100还不卖,现成的规则,又不让你重写新的,还问我仿站多少钱,我仿站3000,咋了,还想分点?

代写规则 难度随意 100元,0基础保教会,如果栏目多,自己又不想动手写的,适当加钱,我全搞定,包售后。

忘记留QQ了 397234392 多年网络接活选手,技术一流,收费三流



和绅1382 发表于 2010-11-8 22:12:53

顶你,好东西ali81ls

buyetian 发表于 2010-11-18 16:06:44

也许是我人品问题,连网址都采不到

buyetian 发表于 2010-11-18 16:34:04

本帖最后由 buyetian 于 2010-11-18 16:35 编辑

搞定了,网址深度改为2,添加了列表页页面选定区域,采集帖子我看采集成功了,未作修改。采集还是蛮简单的。

gohome123 发表于 2010-12-4 10:12:43

能写出收费版本功能的规则才叫牛。

qwe168 发表于 2011-5-31 08:09:52

我怎么打不开文件

aniyscc 发表于 2011-6-9 03:10:32



不知道怎么个情况 我采集了只有20几个文章我搞了下 现在可以了 大家试试吧

pcq333 发表于 2011-6-18 19:42:23

dddddddddddddddd

laoshifu 发表于 2011-7-13 16:25:01

wwwwwwwwwwwwwwwwwwwwwwwwwwww

oursn 发表于 2011-7-27 15:50:33

得顶共享精神ddddddddddddddddddd
页: [1]
查看完整版本: 39健康网采集规则+科讯7.0web发布模块+修改教程+代写规则