晕死,规则都是一样的怎么采集啊?
我想采集这个网址里的内容:http://www.training163.com/locale_show.asp?id=181但是打开他的原文件后发现他里面内容的规则都是一样的,如下:
<tr>
<td align="left" bgcolor="#EEEEEE" class="gao20"> 培训场所英文名:</td>
<td align="left" bgcolor="#FFFFFF" class="gao20"><span class="gao20">jxvc</span></td>
</tr>
<tr>
<td align="left" bgcolor="#EEEEEE" class="gao20"> 培训场所类型:</td>
<td align="left" bgcolor="#FFFFFF" class="gao20">培训中心</td>
</tr>
<tr>
<td align="left" bgcolor="#EEEEEE" class="gao20"> 所在地区:</td>
<td align="left" bgcolor="#FFFFFF" class="gao20">江西-九江</td>
</tr>
<tr>
<td align="left" bgcolor="#EEEEEE" class="gao20"> 详细地址:</td>
<td align="left" bgcolor="#FFFFFF" class="gao20">九江市</td>
</tr>
<tr>
<td align="left" bgcolor="#EEEEEE" class="gao20"> 培训场所联系人:</td>
<td align="left" bgcolor="#FFFFFF" class="gao20">刘丽玲</td>
</tr>
<tr>
<td align="left" bgcolor="#EEEEEE" class="gao20"> 电话1:</td>
<td align="left" bgcolor="#FFFFFF" class="gao20">010-51298009-8005</td>
</tr>
<tr>
<td align="left" bgcolor="#EEEEEE" class="gao20"> 电话2:</td>
<td align="left" bgcolor="#FFFFFF" class="gao20"></td>
</tr>
<tr>
<td align="left" bgcolor="#EEEEEE" class="gao20"> 电话3:</td>
<td align="left" bgcolor="#FFFFFF" class="gao20"></td>
</tr>
<tr>
<td align="left" bgcolor="#EEEEEE" class="gao20"> 传真:</td>
<td align="left" bgcolor="#FFFFFF" class="gao20"></td>
</tr>
<tr>
<td align="left" bgcolor="#EEEEEE" class="gao20"> 电子邮件:</td>
<td align="left" bgcolor="#FFFFFF" class="gao20">redgg@163.com</td>
</tr>
我只想取出其中的几项,请问大家有什么办法吗? 仍然可以。
前面
心</td>
</tr>
<tr>
<td align="left" bgcolor="#EEEEEE" class="gao20">
=============================
:</td>
后面:lol 或者在替换中排除内容
页:
[1]