火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2461|回复: 2

手动填写链接地址规则 测试出来都带host 可以不带么?

[复制链接]
发表于 2014-5-20 15:47:10 | 显示全部楼层 |阅读模式
采集天猫搜索之后的列表页面网址  
例如:http://list.tmall.com/search_product.htm?q=%D0%A1%C5%E8%D4%D4&type=p&spm=a220m.1000858.a2227oh.d100&from=.list.pc_1_searchbutton

多级网址获取
使用脚本规则 <a href="//[参数]" target="_blank"
实际链接 [参数1]

测试出来的结果:

都是这样的地址
http://list.tmall.com/detail.tmall.com/item.htm?id=35579716208&areaId=310000&cat_id=50024907&rn=3835dfd4ef7b7657c808dbaf38d001d9&user_id=326501168&is_b=1&on_comment=1#J_TabBar
实际应该只是
http://detail.tmall.com/item.htm?id=35579716208&areaId=310000&cat_id=50024907&rn=3835dfd4ef7b7657c808dbaf38d001d9&user_id=326501168&is_b=1&on_comment=1#J_TabBar

这前面的
http://list.tmall.com/ 怎么去掉呢?

求高手能人指点。

发表于 2014-5-20 16:38:51 | 显示全部楼层
你可以用参数 获取到 ID 就可以了  然后地址组合
脚本规则 <div class="product" data-id=" [参数]"

实际链接 http://detail.tmall.com/item.htm?id=[参数1]
 楼主| 发表于 2014-5-20 17:04:10 | 显示全部楼层
可以的。 谢谢列车长。 一个id 地址更清晰了。 看来偶还要多实践多总结。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-4-14 19:13

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表