翌凡 发表于 2010-3-3 20:03:43

请教采集高手一个问题

对于这个页面的电话号码有没有好的采集办法?http://www.hhk365.com/qichechuzu/20100303_429173.html

jueshihaogongzi 发表于 2010-3-5 19:32:35

这种格式的电话号码 只能通过外置的程序来实现 本身没有好的办法 qq 1073313989

gdsex 发表于 2010-3-6 22:10:58

其实电话隐藏在源代码中,
如http://www.hhk365.com/qichejiaoyi/20100306_431390.html,图像显示电话号码是13406100001,查看源文件,你可以发现它提交了这个数据“0031200333003470030500361003150030200305003080030400319”,经过分析电话号码就隐藏在这堆数字里面,而且是有规律的,请看
003(1)2003(3)3003(4)7003(0)5003(6)1003(1)5003(0)2003(0)5003(0)8003(0)4003(1)9
把括号的数字合起来就是13406100001。
所以你页面才集这个数,再通过规则转换就成为你要的电话了。
不信你可以测试多几个页面就知道了

翌凡 发表于 2010-3-10 23:31:05

多谢,我去分析下,谢谢

翌凡 发表于 2010-3-10 23:59:47

3K,确实是有这个规律,但是有些也不是,通过规则转换,请问能讲得明白些吗?
页: [1]
查看完整版本: 请教采集高手一个问题