博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
KMP算法 - 求最小覆盖子串
阅读量:6701 次
发布时间:2019-06-25

本文共 1728 字,大约阅读时间需要 5 分钟。

 

KMP与最小覆盖子串

 

最小覆盖子串:对于某个字符串s,它的最小覆盖子串指的是长度最小的子串p,p满足通过自身的多次连接得到q,最后能够使s成为q的子串。

比如:

对于s="abcab",它的最小覆盖子串p="abc",因为p通过在它后面再接上一个p(即重叠0个字符),可以得到q="abcabc",此时s是q的子串。

对于s="ababab",它的最小覆盖子串为p="ab"。

根据KMP算法的next数组的定义,设字符串s的长度为n,则next[n] = next[n - 1],n-1为s的最后一位。

next[n]表明s[0,1,2,...,next[n]-1] == s[n-next[n],...,n-1],设这两段分别为s1和s2。

若s1和s2的长度之和小于s的长度,则说明s1和s2分别为不重叠的前缀和后缀,则最小覆盖子串必为s截去s2之后得到的前缀。

若s1和s2的长度之和大于等于s的长度,则最小覆盖子串也必为s截去s2之后得到的前缀。

以上两种情况都可以推出这个结论:最小覆盖子串是s的前缀,它的长度为n-next[n]。

 

         我对KMP的一些理解(lyp点拨的):pre[i](或next[i])的实质是串str[1..i]的最长且小于i的“相等前、后缀”分别为str[1..pre[i]](前缀)与str[(i-pre[i]+1)..i](后缀),通俗讲就是:使str[1..i]前k个字母与后k个字母相等的最大k值。

KMP算法详解可见:

另外一个结论:

最小覆盖子串(串尾多一小段时,用前缀覆盖)长度为n-next[n](n-pre[n]),n为串长。

证明分两部分:

1-长为n-next[n]的前缀必为覆盖子串。

当next[n]<n-next[n]时,如图a,长为next[n]的前缀A与长为next[n]的后缀B相等,故长为n-next[n]的前缀C必覆盖后缀B;

当next[n]>n-next[n]时,如图b,将原串X向后移n-next[n]个单位得到Y串,根据next的定义,知长为next[n]的后缀串A与长为前缀串B相等,X串中的长为n-next[n]的前缀C与Y串中的前缀D相等,而X串中的串E又与Y串中的D相等……可见X串中的长为n-next[n]的前缀C可覆盖全串。

2-长为n-next[n]的前缀是最短的。

如图c,串A是长为n-next[n]的前缀,串B是长为next[n]的后缀,假设存在长度小于n-next[n]的前缀C能覆盖全串,则将原串X截去前面一段C,得到新串Y,则Y必与原串长度大于next[n]的前缀相等,与next数组的定义(使str[1..i]前k个字母与后k个字母相等的最大k值。)矛盾。得证!有人问,为什么Y与原串长大于next[n]的前缀相等?由假设知原串的构成必为CCC……E(E为C的前缀),串Y的构成必为CC……E(比原串少一个C),懂了吧!

 

最后得出结论:总长度-next[n].

 code:

// Memory   Time// 1347K     0MS// by : Snarl_jsb// 2014-10-02-21.08#include
#include
#include
#include
#include
#include
#include
#include
#include
#include
#include
#include
#define N 1000010#define LL long longusing namespace std;string str;vector
next;void GetNext(){ int len=str.size(); next.push_back(0); int k=0; for(int i=1;i
>str) { next.clear(); int len=str.size(); GetNext();// for(int i=0;i

 

转载地址:http://nngoo.baihongyu.com/

你可能感兴趣的文章
学好Linux决心书
查看>>
Linux SSH远程管理故障如何排查?
查看>>
Centos7.0 搭建Zabbix环境
查看>>
Showdoc 搭建项目 API 文档系统
查看>>
老男孩36期运维脱产班---- 决心书
查看>>
性能优化之NSDateFormatter
查看>>
HTML块级元素
查看>>
树莓派基金会来号召用键盘生物学家研究企鹅
查看>>
Linux内核的裁剪和移植
查看>>
MySQL数据库(二)
查看>>
学习笔记(11月08日)--异常
查看>>
禅道8.2-9.2.1注入GetShell
查看>>
windows7下安装php的imagick和imagemagick扩展教程
查看>>
16. vim
查看>>
行车记录仪稳定方案:TC358778XBG:RGB转MIPI DSI芯片,M-Star标配IC
查看>>
深入理解分布式系统中的缓存架构(下)
查看>>
linux man
查看>>
windows svn
查看>>
CentOS 7 搭建CA认证中心实现https取证
查看>>
PHP商城数据库安全事务处理方法
查看>>