网络实验室

 找回密码
 注册账户
查看: 80799|回复: 9

今天我也说点吧 给大家采集英文数据的一些建议

[复制链接]
无心的棋子 发表于 2007-7-6 21:26:24 | 显示全部楼层 |阅读模式
请先看此帖
http://www.labs.net.cn/thread-14720-1-1.html

其实没有什么的 时间久了自己也明白

大家都知道 建站采集数据来的快
其实你们都漠视了一个非常重要的问题
就是这个问题 导致你们的英文站赚不到钱

问题就出现在数据的质量上
你们采集的时候都是看见哪个站内容多 数据全 容易采  就选择哪个对吧?
大部分人都是这样的 有的好内容 因为规则难写就放弃了
我要上说的就是这个
其实英文站的垃圾站比中文垃圾站还要多 虽然有些垃圾站看起来不象垃圾站
这就导致国外搜索技术性提高 过滤垃圾站的技术明显比中国的搜索强
毕竟国外的技术先进是无可厚非的
『小小的BS国内程序员一下 都是饭桶 80%的软件抄袭国外的 著名的千千静听 抄袭德国的一款播放器 都是抄袭~~ 加个版权就是自己的了 独立开发的人实在少 我们团队也在考虑抄袭:lol 』

说重点 我们应该怎么采集呢?
找到目标站 就是你要采集的站 复制一篇文章标题
打开google  yahoo 分别搜索一下
如果同样的标题 同样的内容 第一页全满的话
那这个站 你就没有必要在采集了

google的标准  普通资料  重复标题 重复内容的 以前是第32次就收录后 就处理掉了 就是排名最后
部分倒霉的米都被K了  N年才更新一次内容 这些都是后遗症~~

我推介大家采集一些小站 小blog 地方内容  
这些在搜索上重复的少

还有就是经常盯着国外关键词排行  看看哪些关键词上的快
算好蜘蛛来的日期  
做关键词  这样来的快 一个月搞一次就好了 一次3-5个关键词
保险些

转帖注明 本文来自 Labs for China  地址:http://www.labs.net.cn/forum-20-1.html
做人要厚道 转贴不保留连接的MJJ   

嗯 以后在写   请大家支持我们 多多转帖些好的文章进来
大家共同讨论项目可行性
论坛没有什么外人~~  :loveliness:
yangbo254 发表于 2007-7-6 22:13:46 | 显示全部楼层
看了,也知道了,很久就在考虑这个大量重复的问题了。

中文是以量为王,国外是以质量为王,这就是中国站长们做E站常常忽略的... ...
yangbo254 发表于 2007-7-6 22:16:22 | 显示全部楼层
我对做E文站有了深深的恐惧…………
    花大力气做的... ...结果1个IP都没来... ...

前几天考虑做个E文站,健康方面的,但是不知道资源从什么地方找,不做咯... ...
dream 发表于 2007-7-6 23:40:31 | 显示全部楼层
我还没开始做英文站,不过在这里学到不少,谢谢啦!
bluebell 发表于 2007-7-7 03:28:52 | 显示全部楼层
E文站就是难来流量:Q
cdroom 发表于 2007-7-8 10:55:49 | 显示全部楼层
内容,数量,版权。很多的问题。捆饶中。。。。
napolong 发表于 2007-10-29 18:03:54 | 显示全部楼层
很实用的方法
咬咬 发表于 2008-10-15 10:10:23 | 显示全部楼层
:)tounge_q 重读
您需要登录后才可以回帖 登录 | 注册账户

本版积分规则

黑屋|存档|手机|网络实验室 本站服务器由美国合租以及IDCLayer国际数据提供!!!

GMT+8, 2024-5-4 20:17 , Processed in 0.062478 second(s), 8 queries , Gzip On, Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表