贾君鹏 发表于 2009-8-9 02:51:00

当前几个主要的Lucene中文分词器的比较

1. 基本介绍:paoding :Lucene中文分词“庖丁解牛” Paoding Analysisimdict :imdict智能词典所采用的智能中文分词程序mmseg4j : 用 Chih-Hao Tsai 的 MMSeg 算法 实现的中文分词器ik :采用了特有的“正向迭代最细粒度切分算法“,多子处理器分析模式2. 开发者及开发活跃度:paoding :qieqie.wang, google code 上最后一次代码提交:2008-06-12,svn 版本号 132imdict :XiaoPingGao, 进入了 lucene contribute,lucene trunk 中 contrib/analyzers/smartcn/ 最后一次提交:2009-07-24,mmseg4j :chenlb2008,google code 中 2009-08-03 (昨天),版本号 57,log为:mmseg4j-1.7 创建分支ik :linliangyi2005,google code 中 2009-07-31,版本号 41
页: [1]
查看完整版本: 当前几个主要的Lucene中文分词器的比较