网站查看源文件时:公司名都看不到,怎么采集呢。大家遇到过吗?
这个网站上:http://www.jobweihai.com/job_recent.jsp,我点查看源文件时,信息列表里公司名,电话等信息都看不到,大家是怎么处理呢?有的 只是文字都加密 了要进行字符转化下采集器是可以实现转换的 流浪侠女 发表于 2012-9-13 09:57 static/image/common/back.gif
有的 只是文字都加密 了要进行字符转化下采集器是可以实现转换的
恩恩,免费版有这个功能吗?是不是得自己找到加密方法呢? 嗯,这个要解密一下就行了...免费版也可以有! ivwghtiqny 发表于 2012-9-15 10:07 static/image/common/back.gif
嗯,这个要解密一下就行了...免费版也可以有!
在么,您好。我应该怎么解密呢?请多多指教 免费版有这个功能吗? belami 发表于 2012-9-15 10:56 static/image/common/back.gif
在么,您好。我应该怎么解密呢?请多多指教
好像有个gbk utf的选择吧? 我也是新手 不是特别清楚 unicode转码的而已!
貌似可以不处理,因为发布出去自动还原了……哈哈!
选择Html Decode 本帖最后由 belami 于 2012-9-18 22:39 编辑
wxl08 发表于 2012-9-18 15:27 static/image/common/back.gif
选择Html Decode
多多谢这位大哥,这个问题就是这么弄的。不过又出现了新问题。里面内容页面显示联系人和电话是通过JSP的,显然这又超出了我的能力范围了,如:http://www.jobweihai.com/api/getentlinktype.jsp?uid=84908。这样出来的我又该怎么处理采集呢?
页:
[1]
2