|
发表于 2009-5-12 12:39:16
|
显示全部楼层
标题:<HTML><HEAD><title> </title>
内容:<td class="p11"><div id="content"><P><BR> </div>
標題規則 : <HTML><HEAD>
雖然該網站的變數大多,但這兩個tag在forum的時候都有機會改變參數,例如<html>可能會因為w3的規則需要而自行加上參數 <html xmlns="http://www.w3.org/1999/xhtml">.
但由於該網站沒有變化,所以您可以采到標題.
而內容里的規則 <td class="p11"><div id="content"><P><BR>
這里的td tag有 class參數在里邊, 這是一個變數,你看到的是class="p11",可能下一頁會變成class="e12"或者其他的class名稱,如果您真是想要以td開始作采集位置,那規則就要變成以下的方式才有效.
内容:<td class="(*)"><div id="content"><P><BR> </div> |
|