枪炮牛仔 发表于 2016-2-1 15:05:06

同一列表下内容页模板各有2种头尾特征各不一样怎么办?



同一列表下:

A内容页----的正文内容的头尾唯一特征字符串为:

开头字符串:<div class="content" id="artibody" data-sudaclick="blk_content">       
结束字符串:<!-- 正文页左下画中画广告 begin -->


B内容页----的正文内容的头尾唯一特征字符串为:

开头字符串:<div class="blkContainerSblkCon BSHARE_POP" id="artibody">
结束字符串:<!--wapdump begin-->



这种情况有没有办法合并在一个采集规则里完成采集呢?

老雷 发表于 2016-2-2 03:47:33

合并重叠,求最大范围。
多余的 代码,干掉。http://i13.tietuku.com/f66937308ccbb8c4.png
页: [1]
查看完整版本: 同一列表下内容页模板各有2种头尾特征各不一样怎么办?