12月26, 2019

sphinx

为什么要用sphinx

  • 做搜索时当数据量大单纯的mysql搜索比较慢(如果表进行了分表更慢)。
  • 搜索时中文分词
  • sphinx快
    • 高速的建立索引(在当代cpu中,峰值性能达10m/s)。
    • 高性能的搜索(在2-4g的文本数据上,平均每次检索时间小于0.1秒)。
    • 可处理海量数据。

如何获取sphinx

如何工作

  • sphinx 配置文件
  • 利用indexer工具生成索引数据 /usr/bin/indexer --config /etc/sphinxsearch/sphinx.conf --all
  • searched:后台进程,使用indexer工具生成的数据做查询

索引文件存储的数据种类

  • .spa存储文档属性
  • .spd存储每个词ID可匹配的文档ID列表
  • .sph存储索引头信息
  • .spi存储词列表
  • .spm存储MVA数据
  • .spp存储每个词的命中列表

本文链接:http://zzl.bzpwhite.cn/post/sphinx.html

-- EOF --

Comments