koto 发表于 2011-10-5 16:25:09

百姓网电话号码采集的问题

本帖最后由 koto 于 2011-10-7 11:01 编辑

百姓网的信息内容页电话号码都生成了图片,而且源码里的地址与实际地址并不一样,举例:
某一个页面电话号码的图片地址是(源码)http://static.baixing.net/pages/mobile.php?c=%2B%1C%1B%0F%32%30%17%0A%16%0E%23%05%10%14%17%0A%0F%31%0E%0F%22%18/3.jpg而此图片的实际地址为http://static.baixing.net/pages/mobile.php?c=%23%99%7c%46%d7%53%b1%5b%be%80%dd%93%72%83%9b%f0/3.jpg这样用火车头采集不下来,不知如何解决此问题?

另外我需要采集百姓网的一些电话号码,并同时将生成了图片的电话转换成数字,哪位有比较好的解决方案?

303718 发表于 2011-10-5 20:09:56

你可以用多页采集试试

koto 发表于 2011-10-5 22:32:03

回复 2# 303718


    不是吧?多页采集不是采页面吗?跟这儿似乎没什么关系。

anine 发表于 2011-10-6 11:47:17

ali88ls数字做成图片容易,图片提取数字难啊。不过能做。

dougeng 发表于 2011-10-7 00:30:25

我可以解决,不过不免费

koto 发表于 2011-10-7 11:02:31

我可以解决,不过不免费
dougeng 发表于 2011-10-7 00:30 http://bbs.locoy.com/images/common/back.gif

嗯哼,我一直没说过免费。

tgmj 发表于 2011-10-10 15:36:01

真实图片的url是通过javascript后加载出来的,我能帮你解决

lovour 发表于 2011-10-17 10:53:48

我一直在采百姓的页面。 通过php函数来实现字符串的转换。并且写好了图片转数字的函数。如有需要。可以联系我。
演示地址:http://h                  o                   me005.com/th            read-htm-fid-47.html

lovour 发表于 2011-10-17 10:54:13

我一直在采百姓的页面。 通过php函数来实现字符串的转换。并且写好了图片转数字的函数。如有需要。可以联系我。
演示地址:               http://hom                   e005.com/thread-                           htm-fid-47.html

hanhualangzi 发表于 2011-10-17 12:38:55

你好,我有采集百姓网所有城市所有手机号码的程序.包括图片手机号码转换为txt格式.要的可加qq 603436562
页: [1] 2
查看完整版本: 百姓网电话号码采集的问题