soarb 发表于 2008-3-10 23:28:58

今天看了一个奇怪的采集规则让我费解


电    话:86 0573 82713922
移动电话:13605739329传    真:86 0573 82713229
地    址: 中国 浙江 嘉兴市 秀州区加拿大科技工业园新农路546号4楼
邮    编:314001
公司主页:


这个代码。用我的思维是写成开始:"移动电话: "       结束 ""可他确写成 开始:“移动电话:(*)” 结束“注:多了个“(*)"照这样理解是自动“推”到下一个</li>或下下一个的,可这规则居然采集成功,一点错误都没有。


下面一些也都一样的。理解不过来!请高手指教

[ 本帖最后由 soarb 于 2008-3-10 23:31 编辑 ]

soarb 发表于 2008-3-10 23:37:28

郁闷!怎么这不能显示源代码呢?我连DZ代码都禁用了! 传个txt

fireye 发表于 2008-3-11 08:55:04

(*)可以替换任何字符,明白不.

soarb 发表于 2008-3-11 11:27:03

原帖由 fireye 于 2008-3-11 08:55 发表 http://bbs.locoy.com/images/common/back.gif
(*)可以替换任何字符,明白不.


就是因为(*)可以替换任务字符才让我费解的。

我可以把(*)理解为替换了“13605739329</li>            <li>传    真:86 0573 82713229”
或再住下一个 li的结束!

所以我想应该是火车运算上原则上我还没清楚。一如五笔 ,取大优先原则之类!

soarb 发表于 2008-3-11 11:28:25

原帖由 fireye 于 2008-3-11 08:55 发表 http://bbs.locoy.com/images/common/back.gif
(*)可以替换任何字符,明白不.


哦,看到了,就是你写的那个阿里白炽灯的采集规则!
页: [1]
查看完整版本: 今天看了一个奇怪的采集规则让我费解