棋子 发表于 2010-1-19 22:21:47

Spider搜索引擎 增强版

Spider搜索引擎 增强版

这个是一个php+mysql架构的的搜索引擎
官方是开源的
但是这个增加了一些转换
比如doc转换为html
等等
这样可以抓取并且分析更多的内容

如果不是独立服务器不要浪费时间了
我测试抓取2个小时 结果mysql数据库到了10多g
数据涨的太厉害了
另外就是索引的问题 数据多了 性能不高
我尝试建立索引后 查询速度没什么变化

下载地址
sphider-plus_v.2.0.zip - 2.5 Mb

sczt 发表于 2010-1-19 22:30:00

支持了,不错的

www.basez.net 发表于 2010-1-22 12:45:42

要是像115小偷那样就好了   在加上自己可以索引 还可做竞价
页: [1]
查看完整版本: Spider搜索引擎 增强版