asyoungyu 发表于 2008-10-17 10:53:41

淘宝,就是采集不到宝贝详情,请指教!

我做的采集规则,可以采集淘宝其他信息,就是采集不到淘宝宝贝详情,就我观察,

淘宝的宝贝详情是通过javascript调用另外一个页面,我也通过多页采集,将这个页面的地址采集到,

但是这个页面没有什么规律,以var desc=' 开始,但是结束的标记就没有什么规律了,

请教高手,怎么样能采集这个页面的全部内容。
附上我的采集规则:

rq204 发表于 2008-10-17 10:54:52

使用正则表达式^var desc=' (?<content>.*?)'$

asyoungyu 发表于 2008-10-17 11:31:16

回复 2楼 的帖子

老大,你这个是正则匹配内容吧,那组合结果怎么写呢,谢谢

vus520 发表于 2008-10-17 11:54:37

不用组合。

飛越無限 发表于 2008-10-17 12:49:48

淘宝是JS调用的。

asyoungyu 发表于 2008-10-17 14:01:38

谢谢,会了,也采集了,顺便提供一下规则

flyk 发表于 2008-10-17 14:43:40

分享下我的笨方法 正则:var desc=[参数]>';   结果:[参数1]>
希望对你以后采集有启示 只要达到目的就好

falchion 发表于 2008-10-22 15:39:05

不错淘宝很好采

chenfy 发表于 2008-11-2 20:15:34

谢谢分享,终于知道怎么去采了,唉,研究了好久啊

dumu 发表于 2008-11-5 00:20:55

受教了,以前也一直奇怪怎么搞不到内容呢?
页: [1] 2
查看完整版本: 淘宝,就是采集不到宝贝详情,请指教!