原题链接P5341 [TJOI2019]甲苯先生和大中锋的字符串

题目描述

大中锋有一个长度为 n 的字符串,他只知道其中的一个子串是祖上传下来的宝藏的密码。但是由于字符串很长,大中锋很难将这些子串一一尝试。

这天大中锋找到甲苯先生算命,但是甲苯先生说:“天机不可泄漏”。

在大中锋的苦苦哀求下,甲苯先生告诉大中锋:“密码是在字符串中恰好出现了 kk 次的子串”。

但是大中锋不知道该怎么做,在大中锋再三的恳求下,甲苯先生看其真诚,又告诉他:“在恰好出现了 k 次的子串中,你去按照字串的长度分类,密码就在数量最多的那一类里”。

大中锋为了尝试这个密码,想让你帮忙找出子串长度出现次数最多的长度数(如果有多个输出最长长度)。

输入输出格式

输入格式:

第一行一个正整数 T ,表示有 T 组测试数据。

接下来 T 行每行包含一个字符串和一个正整数 k 。


输出格式:

一共输出 T 行,每行一个整数表示在出现 k 次的子串中出现次数的最多的长度。如果不存在子串出现 k 次,则输出 −1 。

输入输出样例

输入样例#1: 复制

6
aab 1
abc 1
aaaa 2
abab 2
ababacc 2
abab 4
输出样例#1: 复制

2
1
3
1
2
-1

说明

数据说明

对于第一个数据:其中子串 b,aa,ab,aab 均只出现一次,其中长度为 1 的子串现了 1 次,长度为 2 的子串出现了 2 次,长度为 3 的子串出现了 1 次。所以答案为 2 。

对于第二个数据:其中子串 a, b, c, ab, bc, abc 均只出现一次,其中长度为 1 的子串出现了 3 次,长度为 2 的子串出现了 2 次,长度为 3 的子串出现了 1 次。所以答案为 1 。

对于第三个数据:其中子串 aaa 出现二次,长度为 3 的子串出现了 1 次,其他长度均没有。所以答案为 3 。

对于第四个数据:其中子串 a, b, ab 出现二次,其中长度为 1 的子串出现了 2 次,长度为 2 的子串出现了 1次。所以答案为 1 。

对于第五个数据:其中子串 b, c, ab, ba 出现二次,其中长度为 1 的子串出现了 2 次,长度为 2 的子串出现了 2次。所以答案为 2 。

对于第六个数据:其中子串没有出现四次。所以本题的本题的答案为 −1 。

数据范围

对于 20% 的数据, 1≤k≤n≤10

对于 100% 的数据, 1≤n≤105,1≤T≤100,∑n≤3∗106 ,输入的字符串中仅包含小写英文字母。

题解

 题意概括:给定一个字符串和整数k,求在其中出现次数为k的子串中数量最多的长度

(如果长度为i的出现为k次的子串有ans个,且任意j<i满足长度为j的出现次数为k的子串数量≤ans,j>i则<ans)

算法:统计子串(数量)问题,很容易想到后缀自动机SAM,后缀数组SA

此处介绍SAM的做法,实现很简单,代码接近于模板

实现:

1.初始化,按照原字符串建立SAM,建立后缀树,递归统计子串数量siz

2.核心代码:统计每一种长度的出现次数为k的子串的数量(“子串的数量”为不同子串的种类数

定义ans数组,ans[i]表示长度为i的出现次数为k的子串的数量,ans[x]max=ans[i]则i即为所求

如何求ans数组?

对于每个状态,如果它的siz(代表的子串的出现次数)为k,则其代表的所有子串为所求,故可按长度统计入ans

那状态i代表的子串的长度又几何?

根据后缀自动机性质,令len[i]为状态i表示的最长的子串str[i]的长度,则

①状态i表示的所有子串为str[i]连续的后缀

②状态i的后缀连接指向的状态link[i]表示的所有子串为str[i]的后缀

③len[link[i]]+1等于i表示的最短的子串的长度

所以状态i对ans的贡献即为对于x|len[link[i]]+1≤x≤len[i],ans[x]++;

故可设ans为前缀和数组,将ans[len[link[i]]+1]++,ans[len[i]+1]--;

以下代码可在递归时操作,亦可另起一个循环

if(x&&siz[x]==K){
ans[len[link[x]]+]++;
ans[len[x]+]--;
}

完整代码

 #include<bits/stdc++.h>
using namespace std;
typedef long long LL;
const int INF=1e9+,MAXN=2e5+,MAXC=;
int nxt[MAXN][MAXC],link[MAXN],len[MAXN],lst,sz,siz[MAXN];
inline void extend(int c){
int cur=++sz,p=lst;
len[cur]=len[p]+;
siz[cur]=;
while(p!=-&&!nxt[p][c]){
nxt[p][c]=cur;
p=link[p];
}
if(p==-)
link[cur]=;
else{
int q=nxt[p][c];
if(len[q]==len[p]+)
link[cur]=q;
else{
int clone=++sz;
len[clone]=len[p]+;
memcpy(nxt[clone],nxt[q],sizeof(nxt[clone]));
link[clone]=link[q];
while(p!=-&&nxt[p][c]==q){
nxt[p][c]=clone;
p=link[p];
}
link[q]=link[cur]=clone;
}
}
lst=cur;
}
int tp,head[MAXN],to[MAXN],nxt_[MAXN];
inline void add(int x,int y){
nxt_[++tp]=head[x];
head[x]=tp;
to[tp]=y;
}
int K,ans[MAXN];
void dfs(int x){
for(int i=head[x];i;i=nxt_[i]){
dfs(to[i]);
siz[x]+=siz[to[i]];
}
if(x&&siz[x]==K){
ans[len[link[x]]+]++;
ans[len[x]+]--;
}
}
char str[MAXN];
int M;
int Case;
int main(){
scanf("%d",&Case);
while(Case--){
lst=sz=tp=;
link[]=-;
scanf("%s%d",str+,&K);
M=strlen(str+);
for(int i=;i<=M;i++)
extend(str[i]-'a'),siz[lst]=;
for(int i=;i<=sz;i++)
add(link[i],i);
dfs();
for(int i=;i<=M;i++)
ans[i]+=ans[i-];
int maxi=;
for(int i=M;i>=;i--)
if(ans[i]>ans[maxi])
maxi=i;
printf("%d\n",maxi?maxi:-);
for(int i=;i<=sz;i++){
len[i]=siz[i]=link[i]=;
}
memset(head,,sizeof(head));
memset(ans,,sizeof(ans));
memset(nxt,,sizeof(nxt));
}
return ;
}

最新文章

  1. 树莓派3B更新软件
  2. Oracle常用SQL查询
  3. Python之logging模块
  4. JDBC中的批量插入和乱码解决
  5. C#_MVC_分页update
  6. swf上传
  7. Selenium2Library+ride学习笔记
  8. Ubuntu 13.10 下安装node
  9. html5 存储篇(一)
  10. Python 2.7版本与3.6的不同
  11. Hibernate(六):映射一对多关联关系、双向一对多映射
  12. ReactiveSwift源码解析(四) Signal中的静态属性静态方法以及面向协议扩展
  13. sklearn使用——梯度下降及逻辑回归
  14. cropper.js 裁剪图片
  15. python,异常处理
  16. IPAddress.Any 解决本地ip和服务器ip切换问题
  17. Java设计模式之四 ----- 适配器模式和桥接模式
  18. 编译小米mini openwrt
  19. Hadoop框架
  20. Delphi 19种反调试检测法

热门文章

  1. Debian怎么配置网卡(IP)
  2. python学习2—python3特性与各种运算符
  3. 19-Ubuntu-文件和目录命令-删除文件和目录-rm
  4. Android笔记之ExpandableListView(悬浮吸顶Demo)
  5. CentOS 7 下配置 Nginx + PHP7.1 + MariaDB 以及 Laravel 框架
  6. scala入门基础学习
  7. 【noi.ac-CSP-S全国模拟赛第三场】#705. mmt
  8. Go, JS和Websocket
  9. ubuntu切换到root用户
  10. win10安装mysql__艰难的心路历程