|
|
法号ぺ大师兄(54217578) 13:22:12
问个问题
法号ぺ大师兄(54217578) 13:22:20
高难度采集
法号:采色(11281816) 13:22:25
?
法号ぺ大师兄(54217578) 13:22:33
单任务多网站采集 能成功不
法号ぺ大师兄(54217578) 13:22:57
也就是一条数据中 参数来自多个网站
法号ぺ大师兄(54217578) 13:23:08
法号ぺ大师兄(54217578) 13:23:26
谁有解决办法
法号ぺ大师兄(54217578) 13:24:10
采色 你是采集高手 说下 这样的想法能实现不 用火车头
法号:采色(11281816) 13:25:30
采多个网站
法号ぺ大师兄(54217578) 13:25:37
对
法号:采色(11281816) 13:25:38
不知道你这样做有啥意思
法号:车头(544320478) 13:25:55
还是有意义的呢
法号ぺ大师兄(54217578) 13:26:13
将多个网站的参数集中到一条数据里面
法号:车头(544320478) 13:26:14
比方说一个栏目可以从多个网站上面采集数据
法号ぺ大师兄(54217578) 13:26:30
不是
法号:车头(544320478) 13:26:42
可以列为课题研究下
法号ぺ大师兄(54217578) 13:26:47
我是一篇文章从多个网站上采集数据
法号:采色(11281816) 13:27:12
一篇文章从多个站点采集?
法号ぺ大师兄(54217578) 13:27:36
对 一篇文章的多个参数 来自不同网站上
法号:采色(11281816) 13:28:23
意义不大吧.你的意思是采集变原创?
法号ぺ大师兄(54217578) 13:28:24
这样采集到的能变原创
法号ぺ大师兄(54217578) 13:28:48
意义重大
法号:采色(11281816) 13:28:57
用户体验太烂了.
法号ぺ大师兄(54217578) 13:29:23
先不搞用户体验 先说下程序能实现不
法号:采色(11281816) 13:29:43
不好实现.因为每个站的规则不一样.
法号:采色(11281816) 13:29:49
你这样怎么可能采的到
法号ぺ大师兄(54217578) 13:30:15
比如写规则的时候重新定义下这条规则的采集页面
法号ぺ大师兄(54217578) 13:30:41
加上这个功能就能实现
法号ぺ大师兄(54217578) 13:32:10
法号:采色(11281816) 13:32:27
我没试过,不太清楚.不过我觉得没啥意义,因为新版有很多词库可以替换
法号ぺ大师兄(54217578) 13:33:12
不是单单为了原创 还有其它用途
法号:采色(11281816) 13:33:58
说一下
法号ぺ大师兄(54217578) 13:34:20
比如搞一个规则 内容里添加相关连接 这个相关连接里的内容来源设置多个网站上的
法号ぺ大师兄(54217578) 13:35:14
也就是添加采集相关连接 相关连接来源多个网站上
法号ぺ大师兄(54217578) 13:35:35
就跟那些专题一样的
法号ぺ大师兄(54217578) 13:35:59
法号ぺ大师兄(54217578) 13:38:48
如果能加上这个功能的话采集变原创的可能就会大大增加 天下无敌了
法号ぺ大师兄(54217578) 13:44:17
采集变原创的重要改革
法号:和尚(44201768) 13:44:20
牛人呀.
法号:和尚(44201768) 13:44:30
想到办法记得告诉我.
法号:采色(11281816) 13:44:49
法号:车头(544320478) 13:45:18
确实是个好想法
法号ぺ大师兄(54217578) 13:45:31
就只要加上 写规则的时候重新定义下这条规则的采集页面 就能实现了 估计不难 |
|