computerkiller的博客

博客

标签

数学 trick 算法

$\mathbb Z$ is difficult polynomials are easy

2021-03-21 20:21:38 By computerkiller

$\mathbb Z$ is difficult polynomials are easy

from this

General

$\mathbb Z$ 和 polynomial 上有很多相似问题比如 $\mathbb Z$ 的质因数分解可以对应到 polynomial 的因式分解

事实上有一些在 $\mathbb Z$ 下十分困难的问题在 polynomial 中可以作为普通习题

Example

Fermat's Last Theorem

众所周知的费马大定理:

$a^n+b^n=c^n$ 当 $n \geq 3$ 时没有正整数解

这个问题在上个世纪才被怀尔斯解决证明过程非常复杂但是如果问题是在 polynomial 中便可以很好解决

$f,g,h\in \mathbb C[x]$ 且 $\gcd(f,g,h)=1$ 求证当 $n\geq 3$ 时 $f^n+g^n=h^n\to f,g,h \in \mathbb C$

下面给出证明:

假设当 $n \geq 3$ 时 $f^n+g^n=h^n$ 有解那么: $$ \frac{\operatorname{d}f^n}{\operatorname{d}x}+\frac{\operatorname{d}g^n}{\operatorname{d}x}=\frac{\operatorname{d}h^n}{\operatorname{d}x}=f^{n-1}f^{\prime}+g^{n-1}g^{\prime}=h^{n-1}h^{\prime} $$ 那么: $$ \begin{cases} f^{n}f^{\prime}+g^ng^{\prime}=h^nh^{\prime}\\ f^{n}f^{\prime}+g^{n-1}g^{\prime}f=h^{n-1}h^{\prime}f \end{cases} \to g^{n-1}(f^{\prime}g-fg^{\prime})=h^{n-1}(f^{\prime}h-fh^{\prime}) $$ 假设 $(f^{\prime}g-fg^{\prime})=(f^{\prime}h-fh^{\prime})=0$ 那么我们不难得到 $f,g,h$ 都是常函数

所以 $(f^{\prime}g-fg^{\prime})(f^{\prime}h-fh^{\prime})\neq 0$

那么: $$ \begin{aligned}{} &\,\,\,\,\,\,\,\,\,\begin{cases} f^{n-1}\mid g^{\prime}h-gh^{\prime}\\ g^{n-1}\mid f^{\prime}h-fh^{\prime}\\ h^{n-1}\mid f^{\prime}g-fg^{\prime}\\ \end{cases} \\ &\to \begin{cases} (n-1)\deg f \leq \deg g+\deg h-1\\ (n-1)\deg g \leq \deg f + \deg h - 1\\ (n-1)\deg h \leq \deg f + \deg g - 1\\ \end{cases} \\ &\to \begin{cases} n\deg f \leq \deg f + \deg g + \deg h - 1\\ n\deg g \leq \deg f + \deg g + \deg h - 1\\ n\deg h \leq \deg f + \deg g + \deg h - 1\\ \end{cases} \end{aligned} $$

把上面的三个式子加起来得到: $$ (n-3)(\deg f + \deg g + \deg h) \leq -3 $$ 当 $n\geq 3$ 时显然不成立

ABC-conjecture

ABC 猜想是:

如果 $a,b,c \in \mathbb N$ 满足 $\gcd(a,b,c)=1,a+b=c$ 那么 $\forall \epsilon > 0$ 都 $\exists K_{\epsilon}$ 满足 $c < K_{\epsilon}\operatorname{rad}(abc)^{1+\epsilon}$

其中 $\operatorname{rad}(n)$ 表示 $n$ 的质因子的乘积

转换成 $\mathbb C[x]$ 上的叙述:

如果 $f,g,h \in \mathbb C[x]$ 满足 $\gcd(f,g,h)=1,f+g=h$ 那么 $\deg h<\operatorname{N}(fgh)$

其中 $\operatorname{N}(f)$ 表示 $f$ 的零点个数

下面给出在 $\mathbb C[x]$ 上的证明:

类似于费马大定理中的求导操作我们可以得到: $f^{\prime}g-fg^{\prime}=f^{\prime}h-fh^{\prime}$

而现在我们可以得到: $$ \begin{cases} \gcd(f,f^{\prime})\mid f^{\prime}g-fg^{\prime}\\ \gcd(g,g^{\prime})\mid f^{\prime}g-fg^{\prime}\\ \gcd(h,h^{\prime})\mid f^{\prime}h-fh^{\prime}\to \gcd(h,h^{\prime})\mid f^{\prime}g-fg^{\prime} \end{cases}\\ \to\\ \gcd(f,f^{\prime})\gcd(g,g^{\prime})\gcd(h,h^{\prime}) \mid f^{\prime}g-fg^{\prime}\\ \to\\ \deg \gcd(f,f')+\deg \gcd(g,g')+\deg \gcd(h,h') \leq \deg(f)+\deg(g)-1\\ \to\\ \deg h < \deg f - \deg \gcd (f,f^{\prime}) + \deg g - \deg \gcd (g,g^{\prime}) + \deg h - \deg \gcd (h,h^{\prime}) $$ 下面我们证明一个引理:

Lemma1: $$ \deg f \leq \deg\gcd(f,f^{\prime})+\operatorname{N}(f) $$ 证明的话可以假设 $(x-c)^n\mid f$ 那么 $f=(x-c)^n \hat f$ 那么 $f^{\prime}=(x-c)^n \hat f^{\prime}+n(x-c)^{n-1}\hat f$

通过这个引理便可以直接得到我们要证明的东西

事实上上面我们证明的这个是 Mason's Theorem 借此我们可以证明一个强于 Fermat's Last Theorem for polynomial 的东西:

$f,g,h\in \mathbb C[x]$ 且 $\gcd(f,g,h)=1$ 求证当 $\frac{1}{p}+\frac{1}{q}+\frac{1}{r}\leq 1$ 时 $f^p+g^q=h^r\to f,g,h \in \mathbb C$

下面给出证明:

不失一般地设 $\deg f^p\leq\deg g^q =\deg h^r$

那么: $$ \begin{aligned} p\deg f&<\operatorname{N}(f^pg^qh^r)\\ &=\operatorname{N}(fgh)\\ &\leq\deg f + \deg g + \deg h\\ &\leq\deg f + \frac{p}{q}\deg f + \frac{p}{r}\deg f \end{aligned} $$ 显然可以得到原来的结论

Conclusion

事实上我们不仅仅可以在 polynomial 上证明这些我们甚至可以证明黎曼猜想的 polynomial 版本

当我们尝试把我们的证明带会 $\mathbb Z$ 中去的时候我们发现我们在第一步就卡住了

如何对于 $n\in \mathbb Z$ 定义 $n^{\prime}$ 呢

我们事实上在 DGF 的那套理论中已经得到了一个求导算子但是不幸的是 $D(a+b)\neq D(a)+D(b)$ 而且 $D$ 也不是局部幂零的

所以我们距离一些数论问题还差一个具有以上性质的 $D$ 这是我们与 $\mathbb Z$ 的距离

任重而道远 Finally we've gone so far

引用原来的课件中的一句话:

Be Happy If You Find A Locally Nilpotent Derivation on your ring

如何优雅地进行质因数分解

2020-12-10 20:59:51 By computerkiller

如何优雅地进行质因数分解

在本文中我们将列举一些质因数分解的方法请默认下文中的$n$是待分解的数

下面列举的分解方式有快有慢有些算法在分解一个大质数的时候会非常慢比如Fermat's factorization method Pollard rho 所以我们有必要在分解之前做一次素性测试当然对于大数我们应该使用快速的素性检测算法

我们将先介绍常用的检测算法Miller–Rabin primality test作为前置知识然后开始本文的主要内容

Miller–Rabin primality test

这是一种概率性的素性检测方式依赖于费马小定理和一个引理我们先来复习一下费马小定理: $$ \text{如果 p是一个质数而且}p > 2 \ ,\text{则} a^{p-1}\equiv1\ (mod\ p)\text{对任意a满足}gcd(a,p)=1\text{成立} $$ 用的引理是:

当$p$是一个素数而且$p > 2$时 1在模p意义下不存在非平凡的平方根

我们先阐述一下平凡的定义:由于对于$n\in N$ 都有$(-1)^2\equiv 1\ (mod\ n)$ 和 $1^2\equiv 1\ (mod\ n)$ 所以1和-1是平凡的平方根

下面将证明这个引理:

Proof: $$ \text{我们假设}x\text{是}1\text{在模p意义下的一个非平凡平方根,p是奇质数}\\ x^2\equiv 1\ (mod\ p)\\ (x-1)(x+1)\equiv0\ (mod\ p)\\ \text{即}p|(x-1)(x+1)\\ \text{根据欧几里得引理得到:}p|x-1\text{或}p|x+1\\ \text{此时}x\text{必然是平凡平方根,与题设矛盾,所以引理成立}\\ $$ 接下来解释一下算法的原理:

我们现在有一个奇素数$n$ 并选定一个底数$a,\ gcd(a,n)=1$ 我们表示成费马小定理的形式: $$ a^{n - 1}\equiv 1\ (mod\ n) $$ 我们考虑将$n - 1$表示成$2^st,\ s,t\in N, t\equiv 1\ (mod\ 2)$

那么根据那个引理 1在模$n$下没有非平凡平方根所以对于任意$r\in[0,s-1]$ 满足: $$ a^{d}\equiv 1\ (mod\ n)\\ a^{2^rd}\equiv -1\ (mod\ n)\\ $$ 所以我们一旦找到一个$a$ 使得上式均不满足那么他不然不是素数

代码实现:

int mul(int a,int b,int mod)
{
    int tmp = a * b - (int) ((long double) a * b / mod + 0.5) * mod;
    return tmp < 0 ? tmp + mod : tmp;
}

int ksm(int a,int b,int mod = mod)
{
    int res = 1;
    while (b)
    {
        if (b & 1) res = mul(res,a,mod);
        a = mul(a,a,mod);
        b >>= 1;
    }
    return res;
}

int check(int a,int n)
{
    int b = (n - 1),k = 0;
    while (!(b & 1))
    {
        b >>= 1;
        k++;
    }
    int res = ksm(a,b,n);
    if (res == 1 || res == n - 1) return 0;
    while (k--)
    {
        res = mul(res,res,n);
        if (res == n - 1) return 0;
    }
    return 1;
}

所以我们可以得到Miller–Rabin的板子:

int Miller_Robin(int n)
{
    if (n == 2 || n == 3 || n == 5 || n == 7 || n == 11 || n == 13 || n == 17 || n == 19) return 1;
    if (n == 23 || n == 29 || n == 31 || n == 37 || n == 41) return 1;
    if (n == 46856248255981ll) return 0;
    if (n < 2 || !(n & 1)) return 0;
    if (!(n % 3 && n % 5 && n % 7 && n % 11 && n % 13 && n % 17 && n % 19)) return 0;
    if (!(n % 23) || !(n % 29) || !(n % 31) || !(n % 37) || !(n % 41)) return 0;
    if (check(2,n)) return 0;
    if (check(3,n)) return 0;
    if (check(5,n)) return 0;
    if (check(7,n)) return 0;
    if (check(11,n)) return 0;
    if (check(13,n)) return 0;
    if (check(17,n)) return 0;
    if (check(19,n)) return 0;
    if (check(23,n)) return 0;
    if (check(29,n)) return 0;
    if (check(31,n)) return 0;
    if (check(37,n)) return 0;
    if (check(41,n)) return 0;
    return 1;
}

请记住这个算法并在尝试质因数分解前进行一遍素性检测

Trial division

最朴素的算法我们枚举小于等于$\sqrt{n}$的数然后进行分解这个复杂度是$O(\sqrt{n})$ 当然在合数中的表现普遍优于这个复杂度

接下来我们给出实现:

map<int,int> fac;
for (int i = 2; i * i <= n; i++)
{
    while (!(n % i))
    {
        n /= i;
        fac[i]++;
    }
}
if (n != 1) fac[n]++;

到此我们解决了FACT0 这只是梦的开始（

Wheel factorization

这是对于朴素算法的一个小优化我们发现我们所枚举的数其实只有$\frac{1}{2}$是有用的所以我们可以得到这个实现:

map<int,int> fac;
while (!(n % 2))
{
    n /= 2;
    fac[2]++;
}
for (int i = 3; i * i <= n; i += 2)
{
    while (!(n % i))
    {
        n /= i;
        fac[i]++;
    }
}
if (n != 1) fac[n]++;

这个算法依然是$O(\sqrt{n})$ 这只是常数上的优化

Precomputed primes

上面这个算法优化的方式给了我们启发我们可以打出一张素数表来然后每次跳素数的倍数来优化我们的复杂度:

int pri[N],cnt = 0;
bool vis[N];
map<int,int> fac;
for (int i = 2; i < N; i++)
{
    if (!vis[i]) pri[++cnt] = i;
    for (int j = 1; j <= cnt && i * pri[j] < N; j++)
    {
        vis[i * pri[j]] = 1;
        if (!(i % pri[j])) break;
    }
}
for (int i = 1; i <= cnt && pri[i] * pri[i] <= n; i++)
{
    while (!(n % pri[i])) mp[pri[i]]++,n /= pri[j];
}
for (int d = pri[cnt] + 1,i = 0; d * d <= n; d += pri[++i])
{
    while (!(n % d))
    {
        n /= d;
        fac[d]++;
    }
    if (i == cnt) i = 0;
}
if (n != 1) fac[n]++;

这个的复杂度嘛不太会算(~~神仙教我~~

Fermat's factorization method

费马的方法基于一个简单的平方差: $$ n=a^2-b^2\\ n=(a+b)(a-b)\\ \text{那么假设}n=dc\\ n=(\frac{c+d}{2})^2-(\frac{c-d}{2})^2 $$ 我们的思路是枚举$a$然后计算$b$ 在递归处理$c$和$d$

int fermat(int n) {
    int a = ceil(sqrt(n));
    int b2 = a * a - n;
    int b = round(sqrt(b2));
    while (b * b != b2) {
        a = a + 1;
        b2 = a * a - n;
        b = round(sqrt(b2));
    }
    return a - b;
}

但是费马算法在普通情况下的表现甚至不如朴素算法优秀但是这个算法依然可以使用Wheel factorization 以及 Precomputed primes 进行一定的优化~~我不想写~~

而这个算法让我们把问题有了一定的转化我们可以讲分解质因数的任务转化成一个寻找非平凡因子的问题然后递归处理

Pollard's rho algorithm

Linux自带的factor中所使用的算法期望复杂度在$O(n^{\frac{1}{4}})$ 算法导论上说是$O(\sqrt{p})$ $p$是$n$的最小质因子

我们考虑把一个数分解成两个数乘积的形式:$n=pq$

这个$p$和$q$我们可以考虑递归处理代码大致如下:

void fac(int n)
{
    if (isprime(n)) return ;
    int p = find(n);
    fac(p);
    fac(n / p);
}

我们最关键的问题在于如何找到这个$p$

简单的试除法显然并不满足我们的要求我们需要一个更好的方法考虑求$gcd$

我们假设有了一个数$x$ 那么$gcd(x,n)$一定是$n$的一个约数假设我们找到了这样的一个非平凡约数那么我们就可以把它当作$p$来递归处理了

问题是我们如何来寻找这个$x$呢

根据生日悖论我们可以知道组合取样可以有效地提高我们的效率所以我们考虑生成一个随机的序列:$x_1,x_2,\dots,x_k$

我们所要选择的$p$是选择$1\leq i,j \leq k,p=gcd(|x_i-x_j|,n)$

我们如果真的随机生成了$k$个随机数序列那我们的这个选取的最劣的情况需要$k^2$次即两两枚举$i,j$然后进行计算这样的复杂度并不太能接受

考虑一个伪随机的生成函数: $$ f(x)=(x^2+c)\ mod\ n $$ 可以顺便说一句的是这个函数就是曼德勃罗集 Chaos的特性有效保证了这个函数的随机性

这个函数的图像大概是这个样子的~~经典图片~~:

我们给他一个初始值$x_0$ 通过$x_i=f(x_{i-1})$可以得到一个伪随机序列

我们可以选定一个$x_0$和$c$来得到我们随机的序列

在这个序列上由于足够随机我们可以直接找相邻的两点进行作差得到我们的$p$

这个代数序列上的枚举我们可以观察到形状类似于$\rho$所以我们可以使用Cycle detection来进行随机数的选取

具体地一般有两种方法:Floyd's cycle-finding algorithm和Brent's algorithm

Floyd's cycle-finding algorithm

~~Floyd的这个算法据说是民间算法/? 不管~~

我们考虑一下存在一个循环的条件是:对于任意整数$i\geq \mu,k\geq 0$ 有$x_i=x_{i+k\lambda}$ 其中$\mu$是循环的起始位置 $\lambda$是循环的长度

那我们拿一个双指针第一个双指针$p_1$一步走$1$ 第二个双指针$p_2$一步走$2$ 那么倘若$x_1\neq x_2$ 那么两个指针一定会在相遇且第一次相遇的点到循环终点的距离和起点到循环起点的距离相同

证明是小学二年级就学过的行程问题略

Brent's algorithm

这个算法的思想同样是双指针不同的是采用倍增判断每次跳2的幂次来寻找我们上面提到的$\mu$和$\lambda$

我们在Pollard's Rho中更常用的是Brent's algorithm 因为不难证明的是这种做法的比较次数不高于 Floyd's cycle-finding algorithm 而这个每次比较我们都需要进行一次$\gcd$ 所以使用这个算法可以有效减小我们的常数

最后让我们来看一下这个Pollard's Rho的实现吧:

int Pollard_Rho(int x)
{
    int s = 0,t = 0;
    int c = (int) rand() % (x - 1) + 1;
    int step = 0,goal = 1;
    int val = 1;
    for (goal = 1;; goal <<= 1,s = t,val = 1)
    {
        for (step = 1; step <= goal; ++step)
        {
            t = f(t,c,x);
            val = mul(val,abs(t - s),x);
            if ((step % 127) == 0)
            {
                int d = gcd(val,x);
                if (d > 1) return d;
            }
        }
        int d = gcd(val,x);
        if (d > 1) return d;
    }
}

void fac(int x,int num)
{
    if (x < 2) return ;
    if (Miller_Robin(x))
    {
        maxx = max(maxx,x);
        return ;
    }
    int p = x;
    while (p >= x) p = Pollard_Rho(x);
    int tmp = 0;
    while ((x % p) == 0) x /= p,tmp += num;
    fac(x,num);
    fac(p,tmp);
}

~~其实我的Pollard's Rho就是照着OI-wiki打的~~

到此可以去先写一下FACT1

Algebraic-group factorisation algorithm

高质量好算法(?)

这部分算法主要有三个Pollard's p − 1 algorithm Williams's p + 1 algorithm Lenstra elliptic-curve factorization

我们从比较熟悉的开始讲起

Pollard's p - 1 algorithm

这个发明者和上面那个Pollard's Rho是一样的但是做法很不像这个是基于代数群分解的

我们从费马小定理出发: $$ a^{p-1}\equiv1\mod p\\ a^{(p-1)^k}\equiv a^{k(p-1)} \equiv 1\mod p $$ 所以对于任意$p-1|x$ 有$a^x\equiv 1\mod p$ 也就是$p|gcd(a^x-1,n)$

也就是我们可以得到一个$p$是$n$的一个因数了

显然当 $$ x=\prod_{p\in prime,p\leq B}p^{\lfloor\log_pB\rfloor} $$ 时我们可以一次验证足够多的数得到我们想要的答案

当然这个$B$是不断在变化的

让我们来看一下算法流程:

选定一个$B$ 计算$x$ 选定一个$a$

计算$g = gcd(a^x-1,n)$

如果 $g = 1$ 那么调大$B$ 返回步骤 $2$ 或者分解失败

如果 $g = n$ 那么减小$B$返回步骤 $2$ 或者分解失败

得到一个非平凡因子$g$

但是这个算法在一些数上是无法生效的当一个数的存在两个素因子$p$和$q$满足$p - 1$的最大素因子和$q - 1$的最大素因子相等时这个算法并不能帮我们分解

所以这个算法并不是正确的算法我们可以定义他的复杂度是$\frac{T(n)}{P(n)}$ 即渐近时间除以渐近概率

复杂度是: $$ T(n)=O(B\log B\log^2n)\\ \text{而被分解的概率是}B=\sqrt[a]{n},P(n)=a^{-a}\\ \text{复杂度是}e^{(1+o(1))\sqrt{\log n\log\log n}} $$ 具体地证明这个复杂度的话我们可以发现在进行Miller-Rabin后最小的质因子一定不会大于$\sqrt{n}$

说句闲话由于这个算法的优秀复杂度所以在原来的密码学中有安全素数这个术语即用无法使用这个算法进行分解的数来进行加密

这不是一个正确算法但是还是能帮助得到一些启示让我们把这个问题转化到代数群上考虑

这个算法的本质是在模$p$意义下的群$(\mathcal Z,\times)$ 我们记作$F_p$中任何子群的阶都是$p-1$的因数且任何两个不同的$\mathcal F_p$和$\mathcal F_q$中 $a^{p-1}$和$a^{q-1}$不同所以我们可以把$p$和$q$提取出来

换句话讲考虑我们实际上是把数分解成:$n=ab$而$B$是我们分辨$a$和$b$的阀门若$\varphi(a)$是一个B-smooth数但是$\varphi(b)$不是那么我们救可以把$a$和$b$区分

事实上我们可以换一些群在 Williams's p + 1 algorithm 中就是构造了一个代数群和这个算法非常相似应用也不多不再过多介绍

Lenstra elliptic-curve factorization

这是本文最劲爆的内容了觉得前面的内容简单的可以重连了~~觉得简单的不要声张~~

这个算法知道的人现在应该也不少了qaq

在Pollard's p - 1中会失败的主要原因是群的阶是$p - 1$ 而这个数可能不是powersmooth的

自然数$n$被称之为B-smooth 当且仅当$n$的任何质因数$p$满足$p\leq B$

而B-powersmooth 则是指所有可以整除$n$的形如$p^q$的数其中$p$为质数满足$p^q\leq B$

这个问题在于我们选择群所以我们要考虑更换我们的算法所用到的群

众所周知椭圆曲线上的点构成了一个$(\{(x,y)|x,y\in R\},+)$的群

椭圆曲线

椭圆曲线是以下形式的方程的曲线: $$ E:\ y^2=x^3+ax+b $$ 特别地我们的椭圆曲线不能有奇点一般地我们表示成椭圆的判别式: $$ \Delta=-16(4a^3+27b^2)\neq0 $$ 一般地我们还有当$\Delta>0$时曲线有两个联通分量当$\Delta<0$时曲线只有一个联通分量便于理解给出了一幅Geogebra画的图~~虽然和我们的主题关系并不大~~

我们定义一个无穷远点$O$在$E$上定义点$A'$是点$A$关于$x$轴对称的点

定义在$E$上的两点的加法:

在下图中$A+B=C'$

即从两点$A$和$B$引出的直线和椭圆曲线的第三个交点关于$x$轴的对称点

我们不难发现我们定义的$O$是这个运算的单位元即$A+O=O+A=A$

而当$A=B$且$A$为拐点的时候我们定义$A+A=A'$

不难发现这个群是一个阿贝尔群

对于椭圆点上的有理点和这个运算依然能构成一个群然而有理域依然无法帮我们很好地解决问题所以我们尝试缩小到一个有限域$\mathcal F_n$ 从而得到一个映射平面$(\mathcal Z / n,\mathcal Z)$ 此时的点$O$我们认为是含有$p^x,x>1$因子的坐标: $$ (x_1,y_1)+(x_2,y_2)=(u,v)\\ s=\frac{y_2-y_1}{x_2-x_1}\\ \text{当}x_1=x_2\text{时},(u,v)=O\\ u=s^2-x_1-x_2,v=y_1+s(u-x_1)\\ \text{考虑令}x_1=x_2,y_1=y_2,s=\frac{3x^2+a}{2y}\\ \text{那么}(x,y)+(x,y)=(s^2-2x,y+s(s^2-3x))\\ \text{当}y=0,(x,y)+(x,y)=O $$ 而当在模$n$意义下出现点$O$的时候必然出现了一个点不存在乘法逆元也就找到了一个非平凡因子这个问题就可以得到递归解决了

详细介绍一下算法流程:

选取一个椭圆曲线$E$和上面在群中的一个元素$P=(x,y)$

选定一个值$B$ 这和Pollard's p - 1很类似对于$10^{30}$位左右的数我们一般选取$700$

计算$\left(\displaystyle\prod\limits_{p\in prime,p
在加法求逆的过程中寻找点$O$

复杂度分析类似于Pollard's p - 1 我们当$|(\mathcal Z / n,\mathcal Z)|$是B-smooth的时候停下复杂度是:$O(B\log^2n)$ 终止概率一样是$B=p^\frac{1}{a},P=a^{-a}$

所以$T(n)=e^{(\sqrt{2}+o(1))\sqrt{\log p\log\log p}}$ $p$是$n$最大的因子

到此我们可以解决FACT2

阅读全文

浅谈树上的两个小trick

2020-09-25 14:35:22 By computerkiller

这份Blog将会包括两部分长链剖分和dsu on tree

我们先讲一些前置知识 $\color{red}{轻重链剖分}$吧

我们一般认为的树链剖分默认为轻重链剖分主要的思想在于让重链上的dfn序连续从而将树上的问题转化成几个区间的问题

考虑如何做到这件事情:

在第一次dfs的时候我们便要去处理出来重儿子方便第二次去进行剖分这件事情很$naive$ 就是在dfs的过程中去记录下重儿子的序号

void dfs1(int u,int f)
{
    dep[u] = dep[f] + 1;
    fa[u] = f;
    son[u] = -1;
    siz[u] = 1;
    for (int i = head[u]; i != -1; i = nxt[i])
    {
        int v = pnt[i];
        if (v == f) continue;
        dfs1(v);
        siz[u] += siz[v];
        if (son[u] == -1 || siz[v] > siz[son[u]]) son[u] = v;
    }
}

在第二次dfs的时候优先遍历重儿子再遍历轻儿子这样就可以保证重链上的dfn序连续

void dfs2(int u,int tp)
{
    top[u] = tp;
    dfn[u] = ++cnt;
    rnk[cnt] = u;
    if (son[u] == -1) return ;
    dfs2(son[u],tp);
    for (int i = head[u]; i != -1; i = nxt[i])
    {
        int v = pnt[i];
        if (v == fa[u] || v == son[u]) continue;
        dfs2(v,v);
    }
}

很明显这样剖分完了之后我们做到了重链上dfn序连续并且注意到我们这样剖分完会产生$logn$条链那么我们来看一下树剖之后的小常数求lca

int query(int x,int y)
{
    while (top[x] != top[y])
    {
        if (dep[top[x]] < dep[top[y]]) swap(x,y);
        x = fa[top[x]];
    }
    if (dep[x] > dep[y]) swap(x,y);
    return x;
}

这样子寻找lca的常数很小~~倍增留下了泪水~~

dsu on tree

到这里我们花了60+行解释了树剖终于引出第一个主题 dsu on tree

dsu on tree基于的是树剖的思想让重儿子的贡献直接继承到父亲上而轻儿子的考虑暴力合并

~~无论你是logn - logs的推式子大师还是每次操作后规模减半的毛估估大师~~ 都能发现这个的复杂度是nlogn的在处理子树问题时吊打了树上莫队

我们看一下这样一个代码我们以CF600E为例题分析一下算法的流程:

void dfs(int u)
{
    for (int i = head[u]; i != -1; i = nxt[i])
    {
        int v = pnt[i];
        if (v == fa[u] || v == son[u]) continue;
        dfs(v);
    }
    if (son[u] != -1) dfs(son[u]);
    for (int i = head[u]; i != -1; i = nxt[i])
    {
        int v = pnt[i];
        if (v == fa[u] || v == son[u]) continue;
        dsu(v,1);
    }
    tmp[t[col[u]]] -= col[u];
    t[col[u]]++;
    tmp[t[col[u]]] += col[u];
    if (tmp[maxx + 1]) maxx++;
    if (!tmp[maxx]) maxx--;
    ans[u] += tmp[maxx];
    if (u == top[u]) dsu(u,-1);
}

这个是在树链剖分之后的一个计算答案的dfs 其中的top fa son这些数组和在树链剖分中的同义

在这个过程中不难发现的是我们后遍历了重儿子这是和树剖不同的地方

原因很简单我们遍历轻儿子是为了计算轻儿子的答案而我们的重儿子是直接继承的所以先遍历的话会影响到轻儿子的答案的计算

于是我们有了这样的一个算法流程:

1.计算轻儿子的答案

2.遍历重儿子继承重儿子的答案

3.将轻儿子的贡献暴力计算

4.加上自己的贡献计算自己的答案

5.如果自己是某条重链的头那么自己必然是某个结点的轻儿子了此时我们需要消除我们这棵子树的贡献

上面代码中的dsu函数是对于子树遍历的我给出我的计算方式:

void dsu(int u,int k)
{
    tmp[t[col[u]]] -= col[u];
    t[col[u]] += k;
    tmp[t[col[u]]] += col[u];
    if (tmp[maxx + 1]) maxx++;
    if (!tmp[maxx]) maxx--;
    for (int i = head[u]; i != -1; i = nxt[i])
    {
        int v = pnt[i];
        if (v == fa[u]) continue;
        dsu(v,k);
    }
}

这样dsu on tree的算法部分就讲完了

dsu on tree是一个对于子树问题统计的小trick 很少会作为标算使用但是也有我这里列举几道可以使用的题目按照难度排序

强烈推荐用dsu on tree写一下天天爱跑步写出来的基本都熟练了（

长链剖分

长链剖分相对而言较冷门但是在优化有深度信息的dp时是一个可以考虑的trick

长链剖分是将轻重链剖分的siz计算换成了len的计算及最长的树链长度看dfs1的代码可能会清晰一点:

void dfs1(int u,int f)
{
    son[u] = -1;
    for (int i = head[u]; i != -1; i = nxt[i])
    {
        int v = pnt[i];
        if (v == f) continue;
        fa[v] = u;
        dfs1(v,u);
        len[u] = max(len[u],len[v] + 1);
        if (son[u] == -1 || len[v] > len[son[u]]) son[u] = v;
    }
}

此处的len表示的是某结点的子树中最深的结点到达该结点的距离长链剖分这个trick真的很冷门这里推荐一道模板题吧CF1009F

这题中很明显存在一个很trivial的dp方程:

我们用dp[i][j]表示i的子树中距离i为j的结点个数那么显然有这样的转移:

$$dp[i][j]=\sum\limits_{k\in son_i}dp[k][j-1]$$

有这个转移方程我们有了一个$O(n^2)$的做法但是看到数据范围只能绝望地思考优化

考虑用长链剖分来进行转移大致的思想是直接继承长儿子的状态然后暴力合并短儿子的状态这点上和dsu on tree十分相似但是dsu on tree基于的是重链剖分

在继承长儿子的状态的时候我们必须要做到$O(1)$ 不然复杂度依然爆炸总体上有2种方法:

1.使用指针

2.使用vector的O(1)swap

由于我很不喜欢指针所以一直用的是vector 我这里给出这题的dfs2作参考:

void dfs2(int u,int tp)
{
    top[u] = tp;
    dfn[u] = ++cnt;
    rnk[cnt] = u;
    if (son[u] == -1)
    {
        ans[u] = 0;
        dp[u].push_back(1);
        return ;
    }
    dfs2(son[u],tp);
    swap(dp[u],dp[son[u]]);
    dp[u].push_back(1);
    ans[u] = ans[son[u]];
    if (dp[u][ans[u]] == 1) ans[u] = len[u];
    for (int i = head[u]; i != -1; i = nxt[i])
    {
        int v = pnt[i];
        if (v == fa[u] || v == son[u]) continue;
        dfs2(v,v);
        for (int k = len[v]; k >= 0; k--)
        {
            int tmp = k + len[u] - len[v] - 1;
            dp[u][tmp] += dp[v][k];
            if (dp[u][tmp] > dp[u][ans[u]] || (dp[u][tmp] == dp[u][ans[u]] && tmp > ans[u]))
            {
                ans[u] = tmp;
            }
        }
    }
}

做完了这题之后建议去做一下湖南集训谈笑风生也算是为数不多的可以找到的长链剖分的练习题了吧

结语

无论是长链剖分还是dsu on tree 本质上是直接继承某个儿子的信息然后暴力合并其他的仍然是一种十分优雅的暴力trick

dsu on tree十分好写基本上变化的只有一个dsu函数而长链剖分的实现其实是存在一定的难度的湖南集训那题我写了超久/kk

考虑树上的深度或者子树问题时没有思路的时候大可思考一下这两个trick 会有很多启发的

完结撒花

共 3 篇博客