|
问题是这样的我在这个网页里需要采集某个人评论的信息,评论包括个人点评以及对酒店的星级评价,这个星级有睡眠质量,环境,气氛等项分别打星级,会有这样的情况 评论的人只对睡眠质量这个打了星级,没有对环境气氛评论 (这时候我需要采集的数据就是为空),但是在网页下方有一个对这个酒店的整体评价星级(包括了所有的类别睡眠质量,环境、气氛)源代码中会有相同的唯一代码,我在抓取数据的时候 评论者没有评论的信息则会被抓取成对酒店整体评价的星级,请问这个问题怎么解决。
如下:
http://www.tripadvisor.com/ShowUserReviews-g45963-d1456410-r257646319-Mandarin_Oriental_Las_Vegas-Las_Vegas_Nevada.html#CHECK_RATES_CONT
就是这个网址
代码:
<span class="recommend-titleInline">Stayed January 2015, traveled on business</span>
<ul class="recommend-column first">
<li class="recommend-answer">
<span class="rate sprite-rating_ss rating_ss">
<img class="sprite-rating_ss_fill rating_ss_fill ss40" src="http://e2.tacdn.com/img2/x.gif" alt="4 of 5 stars">
</span>
Value</li>
<li class="recommend-answer">
<span class="rate sprite-rating_ss rating_ss">
<img class="sprite-rating_ss_fill rating_ss_fill ss50" src="http://e2.tacdn.com/img2/x.gif" alt="5 of 5 stars">
</span>
Sleep Quality</li>
</ul>
<ul class="recommend-column">
<li class="recommend-answer">
<span class="rate sprite-rating_ss rating_ss">
<img class="sprite-rating_ss_fill rating_ss_fill ss40" src="http://e2.tacdn.com/img2/x.gif" alt="4 of 5 stars">
</span>
Service</li>
</ul>
</li>
</ul>
</div>
已经纠结一天了 求大神啊 |
|