ly_lmd1981 发表于 2016-1-18 23:29:55

采集内容规则中前后截取问题

本帖最后由 ly_lmd1981 于 2016-1-18 23:31 编辑


<li class="">

<li class="">
                              <span class="stepno"><span class="gou"></span></span>
                <p>发布需求,托管赏金<br/>2016.01.11</p>
            </li>
                  <li class="cur">
                                 <span class="taskmode-clock o-time" data-difftime="642092">剩余<em>...</em></span>
                              <span class="stepno">2</span>
                <p>服务商交稿<br/>2016.01.26</p>
            </li>
                  <li class="gray">
<span class="gou"></span></span>
                <p>发布需求,托管赏金<br/>2016.01.11</p>
            </li>
                  <li class="cur">
                                 <span class="taskmode-clock o-time" data-difftime="642092">剩余<em>...</em></span>
                              <span class="stepno">2</span>
                <p>服务商交稿<br/>2016.01.26</p>
            </li>
                  <li class="gray">


此为源代码,请教为什么采用前后截取采集不到文字呢?内容规则开始代码<span class="stepno">;结束代码<li class="cur">都具有唯一性.

ly_lmd1981 发表于 2016-1-18 23:32:50

是发帖自动显示的,应去掉

303718 发表于 2016-1-19 08:05:46

截取得到的。看你规则没有错呢。

ly_lmd1981 发表于 2016-1-19 22:42:36

D:\1.png

ly_lmd1981 发表于 2016-1-19 22:46:11

303718 发表于 2016-1-19 08:05
截取得到的。看你规则没有错呢。

http://task.zbj.com/6836695/   想截取的内容来自这个页面。想获取预算和发布需求的开始和结束时间,采用前后截取,测试网址总是显示为空。纠结了很久了。请问您能解决这个问题吗?非常感谢哦

ly_lmd1981 发表于 2016-1-19 22:47:56

用的是google chrome浏览器。发现同一页面,不同浏览器显示有较大差别。

imfly 发表于 2016-1-20 09:27:21

http://faq.locoy.com/q-753.html
这种网站需要加cookies

ly_lmd1981 发表于 2016-1-21 22:51:48

imfly 发表于 2016-1-20 09:27
http://faq.locoy.com/q-753.html
这种网站需要加cookies

添加cookies后,已能通过前后截取获取文字。因为是初学者,这个问题纠结了很久了。太感谢你了。以后有问题再向您请教哈,还希望能得到指点哈:)
页: [1]
查看完整版本: 采集内容规则中前后截取问题