|
抓包分析了淘宝客群,其中9块9的地址来说:规则是如下的。
http://pub.alimama.com/group/searchGroupAuctionList.json?spm=0.0.0.0.yORQ0A&groupId=1375950030867&toPage=1&sort=_totalnum&t=1406532456820&_tb_token_=rhlJ2c9LaWn&_input_charset=utf-8
这是淘宝服装的实际链接
其中能获取到的内容有
auctionid商品的编号)
商品名称
商品价格
佣金等
其中要获取两种返利链接的方式,经抓包分析为
http://pub.alimama.com/common/code/getAuctionCode.json?auctionid=38167277724&adzoneid=22448456&siteid=6570706&groupid=1375950030867&t=1406532464376&_tb_token_=rhlJ2c9LaWn&_input_charset=utf-8
其中auctionid就是商品编号
adzoneid
siteid
groupid
是自己网站的信息
t= 这个参数可有可无
实际上要获得
商品直达返利链接,就是只要在第一个页面获取到auctionid然后构造出这一串网址即可,通过再截取可以活动直达链接
{"data":{"eliteUrl":"http://redirect.simba.taobao.com/rd?w=unionnojs&f=http%3A%2F%2Fai.taobao.com%2Fauction%2Fedetail.htm%3Fe%3D6np9mCl7KBEjmraEDZVrLoBzU5g2cZlqbaoUsqSSy3iLltG5xFicOdXrTUTgh9sMDPIwxrc30riELZiKZQKWJHSTZ0u48Xt1YMtGznEF5Vn1xLdrWxvMgOIZWR1bMnHu%26unid%3D15854822%26ptype%3D100010%26from%3Dbasic&k=5ccfdb950740ca16&c=un&b=alimm_0&p=mm_15854822_6570706_22448456","clickUrl":"http://s.click.taobao.com/t?e=m%3D2%26s%3DDGdxUiFkrIEcQipKwQzePOeEDrYVVa64K7Vc7tFgwiFRAdhuF14FMXMwAdyho8Bc79%2FTFaMDK6SUHHw3Ra5Tn%2B9FwEb5ZuCFs6jJ9yb6P4YgZyrOHwGYBqFqHDUWiMHVHiRf3rrkFW%2FBaoglbMAJbLz0WFeCwutZD%2Be6MOt%2Bks0%3D","type":"auction"},"info":{"message":null,"ok":true}}
我做的采集器的插件思路也是这样
pagetype==content
随后用正则获取到auctionid
然后构造出一串网址,放在<lianjie></lianjie>
标签中
此php插件在本机已经通过测试,没有语法等之类的问题,可放在火车头里面,就是获取不到返利链接,不知道问题出在哪?
附上插件源码
if($LabelArray['PageType']=='Content')
{
preg_match_all('/(?<=auctionId":")\d{11}(?=")/',$LabelArray['html'],$auction); //正则匹配出auctionid
$html1="";
for($x=0;$x<count($auction[0]);$x++)
{
$html1.='<auction>http://pub.alimama.com/common/code/getAuctionCode.json?auctionid='.$auction[1][$x].'&adzoneid=22448456&siteid=6570706&groupid=1375950030867&t=1406382536971&_tb_token_=VhW66w43GWn&_input_charset=utf-8</auction>';
}
$LabelArray['html']=$html1;
} |
|