|
|

楼主 |
发表于 2014-5-18 19:53:57
|
显示全部楼层
303718 发表于 2014-5-18 12:02 
http://faq.locoy.com/q-936.html
我的意思不是把整条数据标记为未采...而是仅仅针对那个标签不进行发布..其他能采集到的标签正常发布..
如图..红框里的标签使用了多页采集...
每个标签对应一个多页...
用固定的子串符把标签组合起来,得到一个完整的数据...
但问题来了...因为不是每一条数据都有那么多页面能按照这个规则采到所有数据..
http://www.youku.com/show_page/id_zd23b0d06bee511e3b8b7.html
这个页面其实只有http://www.youku.com/show_episode/id_zd23b0d06bee511e3b8b7.html这里能采集到数据...
http://www.youku.com/show_episode/id_zd23b0d06bee511e3b8b7.html?dt=json&divid=reload_101以后其实都是采集不到的...于是返回了空值...
那么能否仅仅针对这些采集不到的标签进行发布...而播放地址100和其他的则正常发布呢? |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?加入会员
x
|