fireye 发表于 2008-5-14 17:03:06

再次发布阿里巴巴最新供应信息采集规则修正完美版

╄此版本是上次发布阿里巴巴最新供应修正版,上次某一论坛朋友下载规则后发现大量问题,其中最严重就是占用资源过大,由于做规则时没有仔细测试,造成规则不太完美,对此向下载过规则的朋友说起SORRY,并且再次提供修正版。希望朋友们喜欢!!!
(温馨提醒:采集引起的商业纠纷本人概不负责)
一、规则说明书
■采集规则相关说明书
◆所有标签取消正则获取,一律启用开始字符串-结束字符串进行采集,提高采集速度。(这是降低 by rq204)
==============================================================================
◆网址采集取消正则参数获取“缩略图”,并且在采集内容规则添加了【缩略图X】标签,丛面提高网址采集速度。
==============================================================================
◆针对上次规则中,对【内容】标签大量冗余代码,以及各种换行、换页、空白符进行了完美的替换(可仔细看规则)
==============================================================================
◆增加【行业分类】 标签,方便数据发布,以及数据检索。例如-{【行业分类】:化工/合成树脂/脲醛树脂 },
==============================================================================
◆取消原先多页采集, 转成默认页即可采集,再次提高采集速度,正确率就不用讲了。下了规则测试就知道了。
==============================================================================
◆增加了【tags】标签,方便火车免费版的朋友们。下面看看tags的对比。
【SY_tags】: 供应 高密度 密度 刨花板 家具 家私 专用   (标准版用户使用,对标签进行截取)
   ----------------------------------------------------------------------------------------------------
【标题】: 供应高密度板、中密度板、刨花板、家具、家私专用砂带-砂带(此为标题标签)
----------------------------------------------------------------------------------------------------
【tags】: 高密度板 中密度板 刨花板 家具 家私专用砂带 砂带   
(免费版使用,根据<meta获取的,正确率相当不错,特别是发布到Discuz论坛的分类信息中)
==============================================================================
◆修正上规则中,部分采不到电话,传真的问题。并且对空白字符进行了完美的替换。
==============================================================================
◆针对部分分类信息系统,增加了【产品规格】标签,方便使用,不过正确率不高并且】标签包括此标签的内容
==============================================================================
◆针对部分分类信息系统,增加了【品牌】标签,方便使用,不过正确率不高并且】标签包括此标签的内容
==============================================================================
◆此规则与普通规则一样,占用资源很低,请放心使用,呵呵。顺便有些的朋友捐款灾区,祝他们平安。
==============================================================================
二、规则发布说明
有些朋友的分类信息中没有相关的标签,比如【公司网站】,【传真】,【联系人】等等,建议到在模块里的[内容]增加,最好是用<td>或者<br>等等HTML标签来区分,有利于阅读。
   1、适用于PHPCMS企业黄页,DEDECMS的产品模块,Discuz的分类信息,PHP168分类信息系统,易想B2B等等,其它的分类信息请朋友自己看着办吧。
2、*制作此规则纯属个人喜好,所有资料来源于互联网,仅供大家学习与交流之用,切勿用于商业用途,请测试后自行销毁。

*此规则版权属各自产权人所有,超出个人研究范围所引发的版权及责任等问题的争执,后果由当事人自行承担,作者对此不予负责。
*您必须认可上述免责条款,方可使用本作品。如有异议,强烈建议不要使用。
3、感谢你使用本规则,对本规则有任何疑问或建议,欢迎您联系我 QQ:11281816 采色

[ 本帖最后由 fireye 于 2008-5-14 18:02 编辑 ]

ofei 发表于 2008-5-14 17:09:44

我来把可爱的色色沙发坐起

feng115 发表于 2008-5-14 17:52:54

强烈支持了

fireye 发表于 2008-5-14 18:02:00

刚才附件上传错了,太激动了。所以就传错了。

ofei 发表于 2008-5-14 18:02:24

经本人测试确实好用了

c868 发表于 2008-5-14 19:27:06

zheagle 发表于 2008-5-14 20:07:21

正是我想要的!!!

覆雨翻云 发表于 2008-5-14 21:58:37

我看看,真是太好了

rhq001 发表于 2008-5-15 09:49:44

支持

支持

willan 发表于 2008-5-15 09:59:06

谢谢,我测试下
页: [1] 2 3 4 5 6 7 8 9 10
查看完整版本: 再次发布阿里巴巴最新供应信息采集规则修正完美版