sphinx是一款基于SQL的全文搜索引擎,可以理解为对MySQL等数据库中全文搜索特性的另外一种实现。它本身可被整合到MySQL等数据库中,成为一种新的存储引擎;此外,还为一些脚本语言设计了API接口。sphinx从功能上讲比较全面。
它的权重算法也是基于BM25的,这个跟xapian一样,都是目前IR-REL(检索相关度)系列算法里最好的。
目前有两点还搞不太明白:一是它的切词算法,可能它不是通过切词建立索引的,或者是把每个字都切开?二是它的索引如何和MySQL数据库保持同步,是定期同步还是实时同步?准备深入了解一下,虽然不会有实际用途。
是定期同步,需要手工或cron,
定义一个delta
赞赞
那看上去还没有跟mysql完全整合到一起。
赞赞
他不是有MYSQL插件可以用吗
赞赞