sushy 发表于 2008-6-1 00:25:08

简单问题

采集页地址


http://www.xxx.com/display?id=1254

这个最终页面中,我想采集1254所属页面 应该是采集页地址那么如何写开始字符串和 结束字符串 呢?如果这两个项目不填写的话,似乎采集不到该地址,更采不到这个参数。

谢谢。在线等

孤魂 发表于 2008-6-1 00:32:37

看不懂你写的什么意思

sushy 发表于 2008-6-1 00:34:23

http://www.electropedia.org/iev/ ... rm&ievref=101-11-01


这个网址,我像采集它的正文和链接上的   101-11-01字符串,现在正文搞定,如何采集101-11-01?孤魂老大帮个忙,我原来会采集的,好久不用,给忘记啦

孤魂 发表于 2008-6-1 00:58:01

内容页面不是有IEV number 吗,直接采集这个内容就可以了呀

sushy 发表于 2008-6-1 01:01:08

呵呵,现在直接从 title 中间挖了,本来想从链接上采集的,但是看来链接实在没有办法。如果链接最后还有其它的参数,就而已从 ? 到& 了,但是这个是最后一个参数,所以没办法,正则又不会。

谢谢孤魂,

rq204 发表于 2008-6-1 02:38:40



sushy 发表于 2008-6-1 10:21:48

谢谢管理员,这个正则很强大,呵呵,偶多次遇到这种顺序号在链接最后的问题,一致没有解决。
页: [1]
查看完整版本: 简单问题