paopaoke 发表于 2009-12-25 12:44:28

页内选定区域无效问题

本帖最后由 paopaoke 于 2009-12-25 12:45 编辑

这二个标签在这个页内都是唯一的,但采集时还是会跑出去采集别的内容,请问这问题怎么解决?

afanfan2007 发表于 2009-12-25 12:49:07

这个很简单 你可以利用 必须包含和不得包含 来排除掉

paopaoke 发表于 2009-12-25 13:03:29

<!--图片显示方式 -->到<!--文字显示方式 --> 的内容和<!--文字显示方式 -->之后的内容是一样的。

afanfan2007 发表于 2009-12-25 13:12:28

你这个是获取网址   找出需要网址的规律
   然后使用必须包含 不的包含去掉

paopaoke 发表于 2009-12-25 13:20:42

具体是这样的
采集地址:http://product.tech.163.com/mobile/brand/000O0BBV.html
采集区域:埃立特全部机型,不采集上面的埃立特近期热门机型
采集内容:图片,生产商,型号

afanfan2007 发表于 2009-12-25 13:22:43

<div class="tips"> 这里开始
<!--文字显示方式 -->这里结束

paopaoke 发表于 2009-12-25 13:43:24

还是一样跳出去采集

paopaoke 发表于 2009-12-25 13:53:10

本帖最后由 paopaoke 于 2009-12-25 13:54 编辑

采集结果:(有二列的内容是有重复的,就生产商没重复)
【型号】: F1000
M560
X5000
2299
6618
8609
8630
BS811
FN2066
FN2288
FN3010
FN5288
FN8686
L1518
S868
zl888
ZY158
3008
FN1218
8618
FN8688
FN6098
FN1208
FN2046
F1000
M560
X5000
2299
6618
8609
8630
BS811
FN2066
FN2288
FN3010
FN5288
FN8686
L1518
S868
zl888
ZY158
3008
FN1218
8618
【手机图】: <img src="/Image/20091225135147315.jpg"/>
<img src="/Image/20091225135147316.jpg"/>
<img src="/Image/20091225135147317.jpg"/>
<img src="/Image/20091225135147318.jpg"/>
<img src="/Image/20091225135147319.jpg"/>
<img src="/Image/20091225135147320.jpg"/>
<img src="/Image/20091225135147317.jpg"/>
<img src="/Image/20091225135147318.jpg"/>
<img src="/Image/20091225135147321.jpg"/>
<img src="/Image/20091225135147322.jpg"/>
<img src="/Image/20091225135147315.jpg"/>
<img src="/Image/20091225135147323.jpg"/>
<img src="/Image/20091225135147324.jpg"/>
<img src="/Image/20091225135147325.jpg"/>
<img src="/Image/20091225135147326.jpg"/>
<img src="/Image/20091225135147327.jpg"/>
<img src="/Image/20091225135147328.jpg"/>
<img src="/Image/20091225135147329.jpg"/>
<img src="/Image/20091225135147330.jpg"/>
<img src="/Image/20091225135147331.jpg"/>
<img src="/Image/20091225135147332.jpg"/>
<img src="/Image/20091225135147316.jpg"/>
<img src="/Image/20091225135147320.jpg"/>
<img src="/Image/20091225135147333.jpg"/>
<img src="/Image/20091225135147334.jpg"/>
<img src="/Image/20091225135147335.jpg"/>
<img src="/Image/20091225135147336.jpg"/>
<img src="/Image/20091225135147337.jpg"/>
<img src="/Image/20091225135147338.jpg"/>
<img src="/Image/20091225135147339.jpg"/>
【生产商】: 埃立特F1000
埃立特M560
埃立特X5000
埃立特2299
埃立特6618
埃立特8609
埃立特8630
埃立特BS811
埃立特FN2066
埃立特FN2288
埃立特FN3010
埃立特FN5288
埃立特FN8686
埃立特L1518
埃立特S868
埃立特zl888
埃立特ZY158
埃立特3008
埃立特FN1218
埃立特8618
埃立特FN8688
埃立特FN6098
埃立特FN1208
埃立特FN2046

paopaoke 发表于 2009-12-25 15:40:51

搞好了,我加多一级采集就能不用采集区域功能了。谢谢!
页: [1]
查看完整版本: 页内选定区域无效问题