|
今天试用了2.0的暂时发现以下这些问题:
1、编码设定问题。由于我采集的一些网站采集链接的时候可以按默认编码,但是采集回来的网址中有些带有中文,这就需要设定utf的编码。按现在的情况如果设定了utf编码网址便采集不到,反过来采集不到内容。所以编码还是需要分开设定。
中文网址的问题之前我反映过,带中文的网址采集回来的内容中有很大的部分中文字符成了乱码或者根本采集不到内容。如果我把编码换成utf的就可以采集到内容(不过采集的内容还是不全或者有乱码,最终还是需要解决中文网址的问题),从目前的版本看中文网址的问题没解决。
2、循环问题,在2.0好像没有循环次数设定功能。如果在采集论坛的时候需要采集其中的2个回帖那就需要设定3次循环了,但目前2.0的好像没这个功能?
3、分页设定问题,这个2.0和1.21的都没有,不知道默认是采集多少分页?
4、在采集网址的时候不能设定“+”这个条件,比如有写网址中有*****+****我要把他排除掉,排除的条件是“网址中不含 + ”好像不可用。
5、采集链接没显示数目,在测试的时候都不知道采集回来的网址有多少只能手工计算。既然是测试就应该知道我采集回来的网址的数目是否于目标源相同,否则一定是规则不完善或者根本就是错误的。这个功能在1.2的有,怎么到了2.0就没了呢?
6、发布的时候总是出错提示如下
暂时就这些了,以后发现了再补上。
下面顺便看下我用循环采集测试的结果, 1.21的循环分页采集功能更强
1.21 3月份的版本 ( 很经典的哦,谁要的拷贝回去;P)
;P
2.0内侧版,条件一模一样但是采集回来的结果差很多,我测试了好几遍结果都一样。
- 【标题】: 汤加丽写真
- 【内容】: http://www.woaitu.com/meinv/tjl/038.jpg
- http://www.xianwang.com/tangjiali/20060511153030_56855.jpg
- http://www.9bian.com/mm/UploadFiles_3432/200605/2006516115534453.jpg
- http://pic.patchsky.com/infoPic/pic17/pic17692c1.jpg
- http://www.xianwang.com/tangjiali/20060511153030_47566.jpg
- http://www.toto.cc/infoPic/pic54/pic54472c1.jpg
- http://www.woaitu.com/meinv/tjl/079.jpg
- http://www.toto.cc/infoPic/pic54/pic54463c1.jpg
- http://www.babycom.cn/jianfei/jianfei/nvmingxing/tangjiali/tangjiali.jpg
- http://tu.ywzc.net/rtys/tangjiali/32.jpg
- http://www.9bian.com/mm/UploadFiles_3432/200605/2006516115534131.jpg
- http://www.18yihou.com/infoPic/pic51/pic51524c1.jpg
- http://tu.ywzc.net/rtys/tangjiali/28.jpg
- http://tu.ywzc.net/rtys/tangjiali/22.jpg
- http://www.18yihou.com/infoPic/pic51/pic51520c1.jpg
- http://down.veryol.com/uploadfiles/image/10004/TXT-2006425223929360.jpg<BR><P></P><BR><P></P><BR><P></P><BR><P></P><BR><P></P><BR><P></P><BR><P></P><BR><P></P><BR><P></P><BR><P></P><BR><P></P><BR><P></P><BR><P></P><BR><P></P><BR><P></P><BR><P></P><BR><P></P><BR><P></P><BR><P></P>
复制代码
[ 本帖最后由 insun 于 2006-7-11 02:30 编辑 ] |
|