火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3392|回复: 4

无法采集非.htm类的文章列表链接

[复制链接]
发表于 2009-3-8 13:23:05 | 显示全部楼层 |阅读模式
最近采集到了 类似于  "<script type="text/javascript" src="http://dsc02.taobao.com/i2/d91/750/d987576325cfaafb203ae4729461d6fb/T16EVeXkecQtJXXXXX.desc|var^desc;sign^d792593db922ce0de0f57baca7;lang^gbk;t^1236091679"></script>"
<script type="text/javascript">
这样的二级文章列表链接规则

找教程死活找不到怎么采集这种二级分类文章列表链接的方法,是不支持?还是我的思路有问题?请管理员解答!
发表于 2009-3-8 14:28:06 | 显示全部楼层
这个属于脚本类的采集,你可以看下手册里自定义网址的采集方法.
发表于 2009-3-19 15:20:36 | 显示全部楼层
这是JAVA类的数据转换,和平时用的最多的假静态差不多,把以上数据读出来分离开再用程序读出各字段的数据。
现对来说taobao做的假静态联接最狠,还有QQ空间也是用这种方式 。。。。
像像楼上说的那样,把他内容参数自定义出来,然后在实际地址里写上他的 完整联接+[参数1]
如:实际地址是http://www.taobao.com/?237485111
http://www.taobao.com/?[参数]

而下面联接都差不多是用oncikse('id') id就是他的参数变成 [参数] 就可以了。

如:oncikse('237485111')
发表于 2009-3-19 15:28:21 | 显示全部楼层
ali58ls  感觉越来越无聊了,竟教成人来了 。。。。。。。。。。
自已的事都没搞定
发表于 2016-2-9 10:57:53 | 显示全部楼层
和你们一块学习。。。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-24 18:38

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表