sphinx

  sphinx是一款基于SQL的全文搜索引擎,可以理解为对MySQL等数据库中全文搜索特性的另外一种实现。它本身可被整合到MySQL等数据库中,成为一种新的存储引擎;此外,还为一些脚本语言设计了API接口。sphinx从功能上讲比较全面。
  它的权重算法也是基于BM25的,这个跟xapian一样,都是目前IR-REL(检索相关度)系列算法里最好的。
  目前有两点还搞不太明白:一是它的切词算法,可能它不是通过切词建立索引的,或者是把每个字都切开?二是它的索引如何和MySQL数据库保持同步,是定期同步还是实时同步?准备深入了解一下,虽然不会有实际用途。

《sphinx》有3个想法

发表评论

Fill in your details below or click an icon to log in:

WordPress.com 徽标

您正在使用您的 WordPress.com 账号评论。 注销 /  更改 )

Facebook photo

您正在使用您的 Facebook 账号评论。 注销 /  更改 )

Connecting to %s