火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2721|回复: 6

简单问题

[复制链接]
发表于 2008-6-1 00:25:08 | 显示全部楼层 |阅读模式
采集页地址


http://www.xxx.com/display?id=1254

这个最终页面中,我想采集  1254  所属页面 应该是  采集页地址  那么如何写  开始字符串和 结束字符串 呢?如果这两个项目不填写的话,似乎采集不到该地址,更采不到这个参数。

谢谢。在线等
发表于 2008-6-1 00:32:37 | 显示全部楼层
看不懂你写的什么意思
 楼主| 发表于 2008-6-1 00:34:23 | 显示全部楼层
http://www.electropedia.org/iev/ ... rm&ievref=101-11-01


这个网址,我像采集它的正文和链接上的   101-11-01  字符串,现在正文搞定,如何采集  101-11-01  ?孤魂老大帮个忙,我原来会采集的,好久不用,给忘记啦
发表于 2008-6-1 00:58:01 | 显示全部楼层
内容页面不是有IEV number 吗,直接采集这个内容就可以了呀
 楼主| 发表于 2008-6-1 01:01:08 | 显示全部楼层
呵呵,现在直接从 title 中间挖了,本来想从链接上采集的,但是看来链接实在没有办法。如果链接最后还有其它的参数,就而已从 ? 到  & 了,但是这个是最后一个参数,所以没办法,正则又不会。

谢谢孤魂,
发表于 2008-6-1 02:38:40 | 显示全部楼层


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
 楼主| 发表于 2008-6-1 10:21:48 | 显示全部楼层
谢谢管理员,这个正则很强大,呵呵,偶多次遇到这种顺序号在链接最后的问题,一致没有解决。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-5-23 18:04

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表