一张图，让你学会用火车头写采集规则 - 第4页 - 采集器基础使用讨论区 - 火车采集器软件交流官方论坛

主策发表于 2009-6-23 17:42:04

这么神奇!!

bin138 发表于 2009-6-23 18:32:30

vvvvvvvvvvv

lglamway 发表于 2009-6-23 21:17:31

过再结合我分享的规则，应该就学会看看看看，

chowyo 发表于 2009-6-23 21:22:36

看看是什么！！

hlhk 发表于 2009-6-23 23:29:56

先顶在支持!ali67ls

netloss 发表于 2009-6-23 23:39:17

play789 发表于 2009-6-24 05:08:09

谢谢！分离！

play789 发表于 2009-6-24 05:46:30

我看了一下，在采集网址规则第一步时，排除有多余的地方：
<div class="f14list">
<div class="pages"><p><table><tr><td nowrap><a href='/jiankangyinshi.shtml'>首页</a>
修改后：
<div> class="f14list">
</div>

第二步采集内容规则时中的，内容标签中的排除html标签：
钩上Tat|换行
还有框架（iframe)也钩上，在内容排除可把<iframe width="350" height="59" marginwidth="0" marginheight="0" hspace="0" vspace="0" frameborder="0" scrolling="no" bordercolor="#000" src="http://images.sohu.com/bill/s2009/jinzhuxu/zhongshi/jufu.html"></iframe>
这个框架删除。
这样做可简化代码，和优化采集规则呵！

cctext 发表于 2009-6-24 10:03:23

呵呵！支持一下！！

madison 发表于 2009-6-24 12:17:48

靠，怎么发i

页: 1 2 3 [4] 5 6 7 8 9 10 11 12 13

火车采集器软件交流官方论坛's Archiver