今天看了一个奇怪的采集规则让我费解
电 话:86 0573 82713922
移动电话:13605739329传 真:86 0573 82713229
地 址: 中国 浙江 嘉兴市 秀州区加拿大科技工业园新农路546号4楼
邮 编:314001
公司主页:
这个代码。用我的思维是写成开始:"移动电话: " 结束 ""可他确写成 开始:“移动电话:(*)” 结束“注:多了个“(*)"照这样理解是自动“推”到下一个</li>或下下一个的,可这规则居然采集成功,一点错误都没有。
下面一些也都一样的。理解不过来!请高手指教
[ 本帖最后由 soarb 于 2008-3-10 23:31 编辑 ] 郁闷!怎么这不能显示源代码呢?我连DZ代码都禁用了! 传个txt (*)可以替换任何字符,明白不. 原帖由 fireye 于 2008-3-11 08:55 发表 http://bbs.locoy.com/images/common/back.gif
(*)可以替换任何字符,明白不.
就是因为(*)可以替换任务字符才让我费解的。
我可以把(*)理解为替换了“13605739329</li> <li>传 真:86 0573 82713229”
或再住下一个 li的结束!
所以我想应该是火车运算上原则上我还没清楚。一如五笔 ,取大优先原则之类! 原帖由 fireye 于 2008-3-11 08:55 发表 http://bbs.locoy.com/images/common/back.gif
(*)可以替换任何字符,明白不.
哦,看到了,就是你写的那个阿里白炽灯的采集规则!
页:
[1]