yaongzhen 发表于 2009-3-8 13:23:05

无法采集非.htm类的文章列表链接

最近采集到了 类似于"<script type="text/javascript" src="http://dsc02.taobao.com/i2/d91/750/d987576325cfaafb203ae4729461d6fb/T16EVeXkecQtJXXXXX.desc|var^desc;sign^d792593db922ce0de0f57baca7;lang^gbk;t^1236091679"></script>"
<script type="text/javascript">
这样的二级文章列表链接规则

找教程死活找不到怎么采集这种二级分类文章列表链接的方法,是不支持?还是我的思路有问题?请管理员解答!

rq204 发表于 2009-3-8 14:28:06

这个属于脚本类的采集,你可以看下手册里自定义网址的采集方法.

woandmin 发表于 2009-3-19 15:20:36

这是JAVA类的数据转换,和平时用的最多的假静态差不多,把以上数据读出来分离开再用程序读出各字段的数据。
现对来说taobao做的假静态联接最狠,还有QQ空间也是用这种方式 。。。。
像像楼上说的那样,把他内容参数自定义出来,然后在实际地址里写上他的 完整联接+[参数1]
如:实际地址是http://www.taobao.com/?237485111
http://www.taobao.com/?[参数]

而下面联接都差不多是用oncikse('id') id就是他的参数变成 [参数] 就可以了。

如:oncikse('237485111')

woandmin 发表于 2009-3-19 15:28:21

ali58ls感觉越来越无聊了,竟教成人来了 。。。。。。。。。。
自已的事都没搞定

lbjyuer 发表于 2016-2-9 10:57:53

和你们一块学习。。。
页: [1]
查看完整版本: 无法采集非.htm类的文章列表链接