火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3482|回复: 5

请问内容采集规则,如何去掉两边保留中间

[复制链接]
发表于 2008-8-26 11:09:10 | 显示全部楼层 |阅读模式
代码如下:

  1. <p>  必需<span class=yqlink><form class=yqin action=http://www.iask.com/n method=post><input type=hidden name=k value=%D6%AC%B7%BE></form><a href=http://www.iask.com/n?k=%D6%AC%B7%BE target=_blank onClick="activateYQinl(this);return false;" class=akey title=脂肪>脂肪</a></span>酸:</p>
  2. <p>  必需脂肪酸(如亚油酸、亚麻酸)是在您身体中不能合成的,必需从食物中摄取脂肪酸。它们非常重要</p>
复制代码
我想采集后得到:

  1. <p>  必需脂肪酸:</p>
  2. <p>  必需脂肪酸(如亚油酸、亚麻酸)是在您身体中不能合成的,必需从食物中摄取脂肪酸。它们非常重要</p>
复制代码
也就是脂肪能够保留,而去掉

  1. <span class=yqlink><form class=yqin action=http://www.iask.com/n method=post><input type=hidden name=k value=%D6%AC%B7%BE></form><a href=http://www.iask.com/n?k=%D6%AC%B7%BE target=_blank  class=akey title=脂肪>
复制代码


  1. </a></span>
复制代码

这两段,请问该如何写啊??用内容替换还是内容排除啊??

[ 本帖最后由 sisen30000 于 2008-8-26 11:10 编辑 ]
发表于 2008-8-26 11:16:35 | 显示全部楼层
用排除就可以了,排除“<span class=(*)</span>” 
 楼主| 发表于 2008-8-26 11:21:26 | 显示全部楼层
<span class=yqlink><form class=yqin action=http://www.iask.com/n method=post><input type=hidden name=k value=%D6%AC%B7%BE></form><a href=http://www.iask.com/n?k=%D6%AC%B7%BE target=_blank onClick="activateYQinl(this);return false;" class=akey title=脂肪>脂肪</a></span>
谢谢兄弟,脂肪这两个字我想保留啊。
 楼主| 发表于 2008-8-26 11:23:56 | 显示全部楼层
算了,实在不行就直接把form和span a 都不要了。
发表于 2008-8-26 11:58:14 | 显示全部楼层
排除<span class(*) class=akey title=(*)>
排除</a></span>
但这个要看你里面具体的来定
发表于 2008-8-26 13:47:25 | 显示全部楼层
是有损失的内容啊.
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-4-27 05:40

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表