Trie树(字典树,单词查找树)详解+题目
什么是字典树?
- 叫前缀树更容易理解
- 字典树的样子
Trie又被称为前缀树、字典树,所以当然是一棵树。上面这棵Trie树包含的字符串集合是{in, inn, int, tea, ten, to}。每个节点的编号是我们为了描述方便加上去的。比如上图中3号节点对应的路径0123上的字符串是inn,8号节点对应的路径0568上的字符串是ten。终结点与集合中的字符串是一一对应的。
Trie树的性质
- 根节点不包含字符,除根节点外每一个节点都只包含一个字符
- 从根节点到某一节点,路径上经过的字符连接起来,为该节点对应的字符串
- 每个节点的所有子节点包含的字符都不相同
Trie树的存储
struct Trie
{
int son[26]; //son[i]记录的当前节点的子节点
int num; //num是当前这个单词在查询中出现的次数(题目要求)
}a[1000005];
Trie树的两个操作
1. 插入操作 insert(S):将字符串S添加到Trie树中
假设我们要插入字符串”in”。我们一开始位于根,也就是0号节点,我们用P=0表示。我们先看P是不是有一条标识着i的连向子节点的边。没有这条边,于是我们就新建一个节点,也就是1号节点,然后把1号节点设置为P也就是0号节点的子节点,并且将边标识为i。最后我们移动到1号节点,也就是令P=1。
这样我们就把”in”的i字符插入到Trie中了。然后我们再插入字符n,也是先找P也就是1号节点有没有标记为n的边。还是没有,于是再新建一个节点2,设置为P也就是1号节点的子节点,并且把边标识为n。最后再移动到P=2。这样我们就把n也插入了。由于n是”in”的最后一个字符,所以我们还需要将P=2这个节点标记为终结点。
现在我们再插入字符串”inn”。过程也是一样的,从P=0开始找标识为i的边,这次找到1号节点。于是我们就不用创建新节点了,直接移动到1号节点,也就是令P=1。再插入字符n,也是有2号节点存在,所以移动到2号节点,P=2。最后再插入符n这时P没有标识为n的边了,所以新建3号节点作为2号节点的子节点,边标识为n,同时将3号节点标记为终结点:
将后面的字符串int tea ten to都插入之后,就得到了我们一开始给出的Trie:
2. 查询操作 search(S):查询字符串S是否在Trie树中
下面我们再讲一下如何查询Trie树中是不是包含字符串S,也就是之前提到的查找操作。查找其实比较简单。我们只要从根节点开始,沿着标识着S[1] -> S[2] -> S[3] … -> S[S.len]的边移动,如果最后成功到达一个终结点,就说明S在Trie树中;如果最后无路可走,或者到达一个不是终结点的节点,就说明S不在Trie树中。
如图的inn和ten的访问路线
如果是查找”te”,就会从0开始经过5最后到达6。但是6不是终结点,所以te没在Trie树中。如果查找的是”too”,就会从0开始经过5和9,然后发现之后无路可走:9号节点没有标记为o的边连出去。所以too也不在Trie中。
好了,就是这样,题目会在之后放上
最新文章
- Android调用浏览器打开网址遇到的问题
- 自己动手搭建 Redis 环境,并建立一个 .NET HelloWorld 程序测试(转)
- google map 点击获取经纬度
- (step6.3.4)hdu 1151(Air Raid——最小路径覆盖)
- Pilin —— 一个基于Xmpp openfire smack的即时聊天工具
- Jetty监控线程使用情况的配置
- 关于FIND_IN_SET 和distinct 的坑爹的一天
- 使用自定义脚本扩展程序自动执行 VM 自定义任务
- PHP缓存主要技术
- leetcode[60] Rotate List
- 【IE6的疯狂之十二】一个display:none引起的3像素的BUG
- HDU 2119 Matrix
- ASP.NET Core Web API 集成测试中使用 Bearer Token
- Python【每日一问】15
- Spring MVC 中的输入验证 Vlidator
- 100以内奇偶数(for循环)
- 恢复制作了系统盘的U盘
- 2017.7.11 fuse工作原理
- C# iframe session 丢失
- DatePickerDialog TimePickerDialog