火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 4841|回复: 6

请教,文章开头的三位数干扰码怎么去掉?

[复制链接]
发表于 2008-3-14 14:30:55 | 显示全部楼层 |阅读模式
每篇文章开头多了个类似于<p>221<p>的代码,很难处理。

开始字符串为:<div id="articlebody">
结束字符串为:<p id="articlectrl">

碰到这种状况的高手出出招,在此谢过了
发表于 2008-3-14 14:43:07 | 显示全部楼层
在发布内容那边 疲敝就可以撒
 楼主| 发表于 2008-3-14 16:40:51 | 显示全部楼层
原帖由 kylinxu 于 2008-3-14 14:43 发表
在发布内容那边 疲敝就可以撒


这三位数是随机的
发表于 2008-3-14 17:21:45 | 显示全部楼层
<p>221<p>

....
确实不好搞,特别是没有地址测试的情况下,如果放到页面环境中,应该会好一些.
发表于 2008-3-18 09:51:54 | 显示全部楼层
随机的随机的随机的
发表于 2008-3-31 05:17:47 | 显示全部楼层
其他代码可利用代码例如
<div id="?????">
<div id="articlebody">
<p>221<p>
(内容)
<p id="articlectrl">

如果你所说的跟上面差不多的话应该可以解决

前提你<div id="articlebody">上面要有可利用作为 开始字符串
如果有可利用开始字符串,加个排除可以解决的

就例如排除
<div id="articlebody">
<p>(*)<p>

开始字符串为:<div id="?????">
结束字符串为:<p id="articlectrl">
 楼主| 发表于 2008-3-31 17:59:29 | 显示全部楼层
谢谢,试试
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-6 21:42

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表