主策 发表于 2009-6-23 17:42:04

这么神奇!!

bin138 发表于 2009-6-23 18:32:30

vvvvvvvvvvv

lglamway 发表于 2009-6-23 21:17:31

过再结合我分享的规则,应该就学会看看看看,

chowyo 发表于 2009-6-23 21:22:36

看看是什么!!

hlhk 发表于 2009-6-23 23:29:56

先顶在支持!ali67ls

netloss 发表于 2009-6-23 23:39:17

play789 发表于 2009-6-24 05:08:09

谢谢!分离!

play789 发表于 2009-6-24 05:46:30

我看了一下,在采集网址规则第一步时,排除有多余的地方:
<div class="f14list">
<div class="pages"><p><table><tr><td nowrap><a href='/jiankangyinshi.shtml'>首页</a>
修改后:
<div> class="f14list">
</div>

第二步采集内容规则时中的,内容标签中的排除html标签:
钩上Tat|换行
还有框架(iframe)也钩上,在内容排除可把<iframe width="350" height="59" marginwidth="0" marginheight="0" hspace="0" vspace="0" frameborder="0" scrolling="no" bordercolor="#000" src="http://images.sohu.com/bill/s2009/jinzhuxu/zhongshi/jufu.html"></iframe>
这个框架删除。
这样做可简化代码,和优化采集规则呵!

cctext 发表于 2009-6-24 10:03:23

呵呵!支持一下!!

madison 发表于 2009-6-24 12:17:48

靠,怎么发i
页: 1 2 3 [4] 5 6 7 8 9 10 11 12 13
查看完整版本: 一张图,让你学会用火车头写采集规则