火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2961|回复: 0

p8采集问题

[复制链接]
发表于 2010-2-23 17:57:39 | 显示全部楼层 |阅读模式
自定义正则语法规则:
此项可以很精确的分析到要采集的数据,填写后,下面三项建议清空.
举例比如网页中的html代码如下
<tr><td><img src="图片地址"><a href="内容页URL地址" title="注释信息">信息标题</a></td></tr>
那么左边输入
<tr><td><img src="{picurl=NO"}"><a href="{url=NO"}" title="{NO"}">{title=NO<}</a></td></tr>
其中{url=NO"}的意义是地址等于不包含有"双引号的所有字符串
其中{title=NO<}的意义是标题等于不包含有<号的所有字符串
其中{NO"}的意义代表不包含有"号的所有字符串,为何他前面没有等号?那是因为不考虑取他的值,因为每个标题的title都不一样.所以这里要给他定义一个正则语法.其他固定的格式就不必处理了
注:NO后面可以写上任何字符,可多个,但不能为中文,
例如:{url=NO' "=<>}代表除' "=<>他们之外的所有字符串

这上面的怎么看都理解不懂到底是怎么个意思,你可以帮我们说说吗!!

我测试采集成功了的,但是真采集时提示没有选折标题采集会失败,标题怎么设置呢!!!
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

企业微信|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-4-30 21:41

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表