建立全文索引的表的存储引擎类型必须为MyISAM

问题是match   against对中文模糊搜索支持不是太好

新建一个utf8 MyISAM类型的表并建立一个全文索引  :

  1. CREATE TABLE articles (
  2. id INT UNSIGNED AUTO_INCREMENT NOT NULL PRIMARY KEY,
  3. title VARCHAR(200),
  4. body TEXT,
  5. FULLTEXT (title,body)
  6. ) ENGINE=MyISAM  DEFAULT >

其中FULLTEXT(title, body) 给title和body这两列建立全文索引,之后检索的时候注意必须同时指定这两列。

给这个表添加点测试数据

  1. INSERT INTO articles (title,body) VALUES
  2. ('MySQL Tutorial','DBMS stands for DataBase ...'),
  3. ('How To Use MySQL Well','After you went through a ...'),
  4. ('Optimizing MySQL','In this tutorial we will show ...'),
  5. ('1001 MySQL Tricks','1. Never run mysqld as root. 2. ...'),
  6. ('MySQL vs. YourSQL','In the following database comparison ...'),
  7. ('MySQL Security','When configured properly, MySQL ...');

3. 全文检索测试

  1. SELECT * FROM articles   WHERE MATCH (title,body) AGAINST ('database');

注意 MATCH (title,body) 里面的值必须是前面建立全文索引的两个字段不能少。

mysql 默认支持全文检索的字符长度是4,可以用SHOW VARIABLES LIKE 'ft_min_word_len' 来查看指定的字符长度,也可以在mysql配置文件my.ini 更改最小字符长度,方法是在my.ini 增加一行 比如:ft_min_word_len = 2,改完后重启mysql即可。

另外,MySQL还会计算一个词的权值,以决定是否出现在结果集中,具体如下:

mysql在集和查询中的对每个合适的词都会先计算它们的权重,一个出现在多个文档中的词将有较低的权重(可能甚至有一个零权重),因为在这个特定的集中,它有较低的语义值。否则,如果词是较少的,它将得到一个较高的权重,mysql默认的阀值是50%,上面‘you’在每个文档都出现,因此是100%,只有低于50%的才会出现在结果集中。

全文检索语法

SELECT * FROM articles WHERE MATCH (title,body)     AGAINST ('+apple -banana' IN BOOLEAN MODE);   + 表示AND,即必须包含。- 表示NOT,即不包含。

SELECT * FROM articles WHERE MATCH (title,body)     AGAINST ('apple banana' IN BOOLEAN MODE);   apple和banana之间是空格,空格表示OR,即至少包含apple、banana中的一个。

SELECT * FROM articles WHERE MATCH (title,body)     AGAINST ('+apple banana' IN BOOLEAN MODE);   必须包含apple,但是如果同时也包含banana则会获得更高的权重。

SELECT * FROM articles WHERE MATCH (title,body)     AGAINST ('+apple ~banana' IN BOOLEAN MODE);   ~ 是我们熟悉的异或运算符。返回的记录必须包含apple,但是如果同时也包含banana会降低权重。但是它没有 +apple -banana 严格,因为后者如果包含banana压根就不返回。

SELECT * FROM articles WHERE MATCH (title,body)     AGAINST ('+apple +(>banana <orange)' IN BOOLEAN MODE);   返回同时包含apple和banana或者同时包含apple和orange的记录。但是同时包含apple和banana的记录的权重高于同时包含apple和orange的记录

最后如果要模糊搜索只要在在搜索的词后面加上*号就可以,如

"SELECT * FROM table_name WHERE MATCH(column) AGAINST('search*' IN BOOLEAN MODE)"

经测试,非常快速!

最新文章

  1. 使用 Graphviz 画拓扑图
  2. 事务隔离级别(IsolationLevel)
  3. 使用FIR.im发布自己的移动端APP
  4. 更新记录后关闭子窗口并刷新父窗口的Javascript
  5. 用于主题检测的临时日志(431b1c14-8b75-4f42-994f-cfda72208c10 - 3bfe001a-32de-4114-a6b4-4005b770f6d7)
  6. 安卓学习-- RecyclerView简单入门
  7. AS与.net的交互——加载web上的xml
  8. Web CORS 跨域方式使用方式
  9. Linux命令之hwclock
  10. mac 自带 php 验证码 不显示
  11. COJ 0343 WZJ的公司(二)
  12. 【转】一个FAE(AE)的体会和大家交流
  13. MYSQL存储过程注释位置
  14. JS学习笔记(三)函数
  15. win10 UWP RSS阅读器
  16. SQLI DUMB SERIES-21
  17. django-registration
  18. shiro 自定义过滤器,拦截过期session的请求,并且以ajax形式返回
  19. rocketmq集群安装,配置,测试
  20. 动态We API层(动态生成js)

热门文章

  1. mysql常见的问题
  2. Nginx 站点设置目录列表显示
  3. UE4渲染笔记
  4. Ansible------角色
  5. [51nod1965]奇怪的式子
  6. Java中解决前端的跨域请求问题
  7. sass创建web项目环境步骤
  8. RxJS操作符(一)
  9. Win下必备神器之Cmder
  10. matplotlib基本用法-【老鱼学matplotlib】