北京天气预报 规则
XmlData.xml<北京天气预报>
<标签1 标签名="标题" 开始字符串="<title>" 结束字符串="</title>" 内容排除="问天网-" 内容替换="" 采集形式="采集内容" 连接中必须包含="" 连接中不得包含="" 探测真实地址="否" />
<标签2 标签名="来源" 开始字符串="<title>" 结束字符串="</title>" 内容排除="-北京天气详情" 内容替换="" 采集形式="采集内容" 连接中必须包含="" 连接中不得包含="" 探测真实地址="否" />
<标签3 标签名="时间" 开始字符串="<td width="302"><span class="big-cn">预报发布时间:" 结束字符串="</span></td>" 内容排除="" 内容替换="" 采集形式="采集内容" 连接中必须包含="" 连接中不得包含="" 探测真实地址="否" />
<标签4 标签名="内容" 开始字符串="城市搜索">" 结束字符串="<table width="790" height="100"border="0" align="center" cellpadding="0" cellspacing="0" bgcolor="#FFFFFF">" 内容排除="" 内容替换="</form></td>(*)<table width="780" height="5"border="0" cellpadding="0" cellspacing="0">→<table width="780" height="5"border="0" cellpadding="0" cellspacing="0">" 采集形式="采集内容" 连接中必须包含="" 连接中不得包含="" 探测真实地址="否" />
<标签5 标签名="作者" 开始字符串="<title>" 结束字符串="</title>" 内容排除="-北京天气详情" 内容替换="" 采集形式="采集内容" 连接中必须包含="" 连接中不得包含="" 探测真实地址="否" />
<分页设置 形式="全部" 分页开始="" 分页结束="" />
<分页合并 形式="回车" 分页代码="#p#" />
<内容循环 次数="1" 测试页面="http://weather.tq121.com.cn/detail.php?city=%B1%B1%BE%A9" />
<源站编码 编码="Default" />
</北京天气预报>
URldata.xml
<天气预报>
<全部网址>http://weather.tq121.com.cn/detail.php?city=%B1%B1%BE%A9 </全部网址>
</天气预报>
还有一个小小的问题.那些什么"休闲指数"的图片都采下来了,但是那多云、晴……等图片却采不下来,这是为什么呢?
页:
[1]