|
接口教程过几天出一个视频版吧,这一点点敲字 比较麻烦,必定接口教程是比较复杂的。
最近接一个任务。采集58同城的信息。当然具体方法有很多种。为了速度和效率我选择了采集WAP.58.COM
大概几十个城市,任务要求是按照分类进行采集,而不是按照城市进行采集。尽管这样几十个城市用手一点点加你不累我也累啊
程序开发的人总是那些比较懒的人,想节约时间少做点事情么。所以我只写几行代码 就可以搞定几分钟甚至十几分钟几十分钟搞定的事情
好
第一步分析采集页
以俺所在的城市为例,http://wap.58.com/sjz_shoujipn2/
PN2中的2是页码在火车页面设置的时候就是
http://wap.58.com/sjz_shouji/0/pn(*)/
添加100页后的形式是
http://wap.58.com/sjz_shouji/pn<1,100,1,False,False>
好的 那看看其他城市的
http://wap.58.com/bj_shouji 北京的
http://wap.58.com/sh_shouji 上海的
以此类推 不同城市只有中间城市名称不同而已
那对应的添加分页后的形式也是中间的城市名不同而已
那么 我们分析过后就可以写代码了
第二步写程序
规律找到了 就写程序吧,采集地址的分类是变的_shouji 城市是变的
我做两个文本框 提交各表单。让程序去处理 如图
提交表单后会自动生成我要采集的地址。演示下运行后结果比如手机
这地址就生成了。很省心吧 当然程序是自己用的 也没什么美工什么字体,都无所谓了我只要地址而已。
将这些地址复制到火车里测试下
效果不错么,至于规则我就不多说了。很简单的,至于有的朋友采集过58WAP页面 仔细的朋友会发现地址里有个。带a的地址页面数据多啊。自己体会吧 不多说了和今天的内容没关系。
可以用了那么说下核心代码。其实很简单 任何一个学过一点点程序的人都会做的,只是有可能你不需要这个,有可能你没想到。当手动和自动两个进行选择的手自动做程序要花的时间远远小于你手动改的时间,为什么不去写短小代码呢。
我是用ASP做的,
下面看下代码- <%
- if request("action")="make" then
- city = Request.Form("city")
- ad = Request.Form("ad")
- city = split(city,",")
- for i = 0 to ubound(city)
- response.write "http://wap.58.com/"+city(i)+"_"+ad+"/pn<1,100,1,False,False>"+"<br>"
- next
- end if
- %>
复制代码 只有这么几行就搞定你有添加又修改的 咋样 够简单吧
我用city文本框添加城市 并用逗号分开 看到city = split(city,",") 得到的数据后进行切分成数组split 这个函数 几乎大部分语言都有这个函数。
然后对数组循环输出就可以了 没任何难度,当然也可以变化成其他方式。那就看大家的想法了
最后附上源代码 ASP环境不多说了, 我的联系方式1754-7523
下一U教程介绍 插件教程-为内容字指定符加锚文本 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?加入会员
x
评分
-
1
查看全部评分
-
|