火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 1997|回复: 4

请问关于文章标题正文规则的疑问。一个站2个样式呢?

[复制链接]
发表于 2009-7-26 19:31:21 | 显示全部楼层 |阅读模式
在一个网站里面的同个栏目下的文章。

有些文章是样式一。有些是样式二。请问下该怎么设置呢

标题样式一:
  1. <div class="art_l_text">
  2.       <h1>标题</h1>
复制代码


标题样式二:

  1. <div class="blkContainerSblk">
  2.           <h1 id="artibodyTitle">标题</h1>
复制代码


正文样式一:
  1. <div class="blkContainerSblkCon" id="artibody">正文
  2.             <div class="cupage"> </div>
复制代码


正文样式二:
  1. <div class="art_blkContainerSblkCon" id="artibody"> 正文
  2.    <div class="clear"></div>
复制代码


谢谢大家了
发表于 2009-7-26 20:02:58 | 显示全部楼层
发表于 2009-7-26 23:14:13 | 显示全部楼层
用正则就行了
发表于 2009-7-27 03:19:31 | 显示全部楼层
本帖最后由 edyedyedy 于 2009-7-27 18:33 编辑

标题正则:
<h1(*)>[参数]</h1>

页面中如果有多个h1标记的话就要看更详细的代码
正文正则:
blkContainerSblkCon" id="artibody">[参数]</div>
添加排除:
            <div class="cupage">
   <div class="clear"></div>
 楼主| 发表于 2009-7-27 11:12:22 | 显示全部楼层
好的。谢谢楼上的朋友了。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-5-19 23:05

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表