Unverified Commit 3bfb0630 authored by Xeonacid's avatar Xeonacid Committed by GitHub
Browse files

Merge branch 'master' into dmst

parents df207d77 61bf52df
Loading
Loading
Loading
Loading
+53 −5
Original line number Diff line number Diff line
Shell 排序是以它的发明者命名的,也称为缩小增量排序法。Shell 排序对不相邻的记录进行比较和移动:
本页面将简要介绍希尔排序。

1. 将待排序序列分为若干子序列(每个子序列的元素在原始数组中间距相同)
2. 对这些子序列进行插入排序
3. 减小每个子序列中元素之间的间距,重复上述过程直至间距减少为 1
## 简介

Shell 排序的复杂度和间距序列的选取(就是间距如何减小到 1)有关,比如“间距每次除以 3”的 Shell 排序的复杂度是 $O(n^{3/2})$ 。
希尔排序(英文:Shell sort),也称为缩小增量排序法,是 [插入排序](insertion-sort.md) 的一种改进版本。希尔排序以它的发明者希尔(英文:Donald Shell)命名。

## 工作原理

排序对不相邻的记录进行比较和移动:

1. 将待排序序列分为若干子序列(每个子序列的元素在原始数组中间距相同);
2. 对这些子序列进行插入排序;
3. 减小每个子序列中元素之间的间距,重复上述过程直至间距减少为 1。

## 性质

### 稳定性

希尔排序是一种不稳定的排序算法。

### 时间复杂度

希尔排序的最优时间复杂度为 $O(n)$ 。

希尔排序的平均时间复杂度和最坏时间复杂度与间距序列的选取(就是间距如何减小到 1)有关,比如「间距每次除以 3」的希尔排序的时间复杂度是 $O(n^{3/2})$ 。已知最好的最坏时间复杂度为 $O(n \log^2n)$ 。

### 空间复杂度

希尔排序的空间复杂度为 $O(n)$ 。

## 实现

### C++[^ref1]

```cpp
template <typename T>
void shell_sort(T array[], int length) {
  int h = 1;
  while (h < length / 3) {
    h = 3 * h + 1;
  }
  while (h >= 1) {
    for (int i = h; i < length; i++) {
      for (int j = i; j >= h && array[j] < array[j - h]; j -= h) {
        std::swap(array[j], array[j - h]);
      }
    }
    h = h / 3;
  }
}
```

## 参考资料与注释

[^ref1]:  [希尔排序 - 维基百科,自由的百科全书](https://zh.wikipedia.org/wiki/%E5%B8%8C%E5%B0%94%E6%8E%92%E5%BA%8F) 
+1 −0
Original line number Diff line number Diff line
@@ -38,6 +38,7 @@ author: Suyun514, ChungZH, Enter-tainer, StudyingFather, Konano, JulieSigtuna, G
-  [AtCoder](https://atcoder.jp/) :日本 OJ,日文版里会有日本高校的比赛,英文内不会显示。题目有趣,质量较高。
-  [CodeChef](https://codechef.com/) :印度 OJ,周期举办比赛。系统基于 SPOJ 的 Sphere Engine。
-  [Codeforces](https://codeforces.com/) :俄罗斯 OJ,始于 2010 年,创始人是 [Mike Mirzayanov](https://www.linkedin.com/in/mike-mirzayanov-31772a93/) 。有多种系列的比赛,并支持个人出题、申请组织比赛。题目质量较高。
-  [CSES](https://cses.fi/problemset/) (Code Submission Evaluation System),按专题划分的题库, [旨在](https://cses.fi/problemset/text/1810) 成为综合的高质量题库,目前只有 200 题,主要由 [Competitive Programmer’s Handbook](https://cses.fi/book/book.pdf) 作者 Antti Laaksonen 开发,始于 2013。
-  [CS Academy](https://csacademy.com/) 
-  [DMOJ](https://dmoj.ca/) 加拿大开源的 OJ,语言支持广;题库是各大比赛的存档,也有定期自行举办的比赛。
-  [HackerRank](https://www.hackerrank.com/) 有很多比赛
+5 −5
Original line number Diff line number Diff line
@@ -44,11 +44,11 @@ $$
定义势能函数 $\Phi(S)=\sum\limits_{x\in S}\Phi(x)$ ,其中 $S$ 表示一整个并查集,而 $x$ 为并查集中的一个节点。定义 $\Phi(x)$ 为:

$$
\Phi(x)=\left\{
\begin{aligned}
&\alpha(n)\times rnk(x)& &rnk(x)=0\text{ 或 x为某棵树的根节点}&\\
&(\alpha(n)-level(x))\times rnk(x)-iter(x)& &otherwise&
\end{aligned}\right.
\Phi(x)=
\begin{cases}
\alpha(n)\times \mathit{rnk}(x)& \mathit{rnk}(x)=0\text{或}x\text{为某棵树的根节点}&\\
(\alpha(n)-\mathit{level}(x))\times \mathit{rnk}(x)-iter(x)& \mathit{otherwise}&
\end{cases}
$$

然后就是通过操作引起的势能变化来证明摊还时间复杂度为 $\Theta(\alpha(n))$ 啦。注意,这里我们讨论的 $union(x,y)$ 操作保证了 $x$ 和 $y$ 都是某个树的根,因此不需要额外执行 $find(x)$ 和 $find(y)$ 。
+194 −189
Original line number Diff line number Diff line
介绍和队列有关的数据结构及其应用。
页面介绍和队列有关的数据结构及其应用。

## 队列

队列,英文名是 queue,在 C++ STL 中有 [std::queue](https://en.cppreference.com/w/cpp/container/queue)[std::priority_queue](https://en.cppreference.com/w/cpp/container/priority_queue) 
队列(queue)是一种具有「先进入队列的元素一定先出队列」性质的表。由于该性质,队列通常也被称为先进先出(first in first out)表,简称 FIFO 表

先进入队列的元素一定先出队列,因此队列通常也被称为先进先出(first in first out)表,简称 FIFO 表
C++ STL 中实现了 [队列 `std::queue` ](https://zh.cppreference.com/w/cpp/container/queue)[优先队列 `std::priority_queue` ](https://zh.cppreference.com/w/cpp/container/priority_queue) 两个类,定义于头文件 [ `<queue>` ](https://zh.cppreference.com/w/cpp/header/queue)

注: `std::stack``std::queue` 都是容器适配器,默认底层容器为 `std::deque` (双端队列)。
???+note
     `std::queue` 是容器适配器,默认的底层容器为双端队列 [ `std::deque` ](https://zh.cppreference.com/w/cpp/container/deque)

## 双端队列
## 队列模拟

双端队列是指一个可以在队首/队尾插入或删除元素的队列。相当于是栈与队列功能的结合。具体地,双端队列支持的操作有 4 个:

1. 在队首插入一个元素
2. 在队尾插入一个元素
3. 在队首删除一个元素
4. 在队尾删除一个元素

## 数组模拟队列
### 数组模拟队列

通常用一个数组模拟一个队列,用两个变量标记队列的首尾。

@@ -25,62 +19,71 @@
int q[SIZE], ql = 1, qr;
```

插入元素: `q[++qr]=x;` 
- 插入元素: `q[++qr]=x;` 

删除元素: `++ql;` 
- 删除元素: `++ql;` 

访问队首/队尾: `q[ql]` / `q[qr]` 
- 访问队首/队尾: `q[ql]` / `q[qr]` 

清空队列: `ql=1;qr=0;` 
- 清空队列: `ql=1;qr=0;` 

数组模拟双端队列是同理的。
### 双栈模拟队列

## 循环队列
还有一种冷门的方法是双栈模拟队列

样会导致一个问题:随着时间的推移,整个队列会向数组的尾部移动,一旦到达数组的最末端,即使数组的前端还有空闲位置,再进行入队操作也会导致溢出。(这种数组上实际有空闲位置而发生了上溢的现象称为是“假溢出”。
种方法使用两个栈 F,S 模拟一个队列,其中 F 是队尾的栈,S 代表队首的栈,支持 push(在队尾插入),pop(在队首弹出)操作:

解决假溢出的办法是采用循环的方式来组织存放队列元素的数组,即将数组下标为 0 的位置看做是最后一个位置的后继。( `x` 的后继为 `(x + 1) % Size` )。这样就形成了循环队列。
- push:插入到栈 F 中。
- pop:如果 S 非空,让 S 弹栈;否则把 F 的元素倒过来压到 S 中(其实就是一个一个弹出插入,做完后是首位颠倒的),然后再让 S 弹栈。

## 双栈模拟队列
容易证明,每个元素只会进入/转移/弹出一次,均摊复杂度 $O(1)$ 。

其实不仅仅可以用数组模拟队列,还有一种冷门的方法是双栈模拟队列
## 特殊的队列

我们使用两个栈 F,S 模拟一个队列,其中 F 是队尾的栈,S 代表队首的栈,支持 push(在队尾插入),pop(在队首弹出)操作:
### 双端队列

1. Push:插入到栈 F 中
2. Pop:如果 S 非空,让 S 弹栈;否则把 F 的元素倒过来压到 S 中(其实就是一个一个弹出插入,做完后是首位颠倒的),然后再让 S 弹栈。
双端队列是指一个可以在队首/队尾插入或删除元素的队列。相当于是栈与队列功能的结合。具体地,双端队列支持的操作有 4 个:

容易证明,每个元素只会进入/转移/弹出一次,均摊复杂度 $O(1)$ 。
- 在队首插入一个元素
- 在队尾插入一个元素
- 在队首删除一个元素
- 在队尾删除一个元素

有人问这个东西有什么用吗?参见下面这道题。这道题顺便可以给大家一个 **双栈模拟双端队列** 的方法。
数组模拟双端队列的方式与普通队列相同。

### 循环队列

使用数组模拟队列会导致一个问题:随着时间的推移,整个队列会向数组的尾部移动,一旦到达数组的最末端,即使数组的前端还有空闲位置,再进行入队操作也会导致溢出(这种数组里实际有空闲位置而发生了上溢的现象被称为“假溢出”)。

解决假溢出的办法是采用循环的方式来组织存放队列元素的数组,即将数组下标为 0 的位置看做是最后一个位置的后继。(数组下标为 `x` 的元素,它的后继为 `(x + 1) % SIZE` )。这样就形成了循环队列。

## 例题

 [LOJ6515「雅礼集训 2018 Day10」贪玩蓝月](https://loj.ac/problem/6515) 
???+note "[LOJ6515「雅礼集训 2018 Day10」贪玩蓝月](https://loj.ac/problem/6515)"

    一个双端队列(deque),m 个事件:

> 一个双端队列(deque),m 个事件:
>
> 1. 在前端插入 (w,v)
> 2. 在后端插入 (w,v)
> 3. 删除前端的二元组
> 4. 删除后端的二元组
> 5.  给定 l,r,在当前 deque 中选择一个子集 S 使得 $\sum_{(w,v)\in S}w\bmod p\in[l,r]$ ,且最大化 $\sum_{(w,v)\in S}v$ .
>
>      $m\leq 5\times 10^4,p\leq 500$ .
    1. 在前端插入 (w,v)
    2. 在后端插入 (w,v)
    3. 删除前端的二元组
    4. 删除后端的二元组
    5.  给定 l,r,在当前 deque 中选择一个子集 S 使得 $\sum_{(w,v)\in S}w\bmod p\in[l,r]$ ,且最大化 $\sum_{(w,v)\in S}v$ .

### 离线算法
    $m\leq 5\times 10^4,p\leq 500$ .

??? note "解题思路"

    每个二元组是有一段存活时间的,因此对时间建立线段树,每个二元组做 log 个存活标记。因此我们要做的就是对每个询问,求其到根节点的路径上的标记的一个最优子集。显然这个可以 DP 做。 $f[S,j]$ 表示选择集合 S 中的物品余数为 j 的最大价值。(其实实现的时侯是有序的,直接 f[i,j]做)

    一共有 $O(m\log m)$ 个标记,因此这么做的话复杂度是 $O(mp\log m)$ 的。

### 在线算法
    ---

这是一个在线算法比离线算法快的神奇题目。而且还比离线的好写
    这是一个在线算法比离线算法快的神奇题目。而且还比离线的好写

    上述离线算法其实是略微小题大做的,因为如果把题目的 deque 改成直接维护一个集合的话(即随机删除集合内元素),那么离线算法同样适用。既然是 deque,不妨在数据结构上做点文章。

### 栈
    ---

    如果题目中维护的数据结构是一个栈呢?

@@ -90,27 +93,27 @@ $$
    f[i,j]=\max(f[i-1,j],f[i-1,(j-w_i)\bmod p]+v_i)
    $$

妥妥的背包啊
    妥妥的背包啊

    删除的时侯直接指针前移即可。这样做的复杂度是 $O(mp)$ 的。

### 队列
    ---

    如果题目中维护的数据结构是队列?

有一种操作叫双栈模拟队列。这就是这个东西的用武之地。因为用栈是可以轻松维护 DP 过程的,而双栈模拟队列的复杂度是均摊 $O(1)$ 的,因此,复杂度仍是 $O(mp)$ .
    有一种操作叫双栈模拟队列。这就是这个东西的用武之地。因为用栈是可以轻松维护 DP 过程的,而双栈模拟队列的复杂度是均摊 $O(1)$ 的,因此,复杂度仍是 $O(mp)$ 

### 双端队列
    ---

    回到原题,那么 Deque 怎么做?

类比推理,我们尝试用栈模拟双端队列,于是似乎把维护队列的方法扩展一下就可以了。但如果每次是全部转移栈中的元素的话,单次操作复杂度很容易退化为 $O(m)$ .
    类比推理,我们尝试用栈模拟双端队列,于是似乎把维护队列的方法扩展一下就可以了。但如果每次是全部转移栈中的元素的话,单次操作复杂度很容易退化为 $O(m)$ 

于是乎,神仙的想一想,我们可以丢一半过去啊
    于是乎,神仙的想一想,我们可以丢一半过去啊

    这样的复杂度其实均摊下来仍是常数级别。具体地说,丢一半指的是把一个栈靠近栈底的一半倒过来丢到另一个栈中。也就是说要手写栈以支持这样的操作。

### 丢一半的复杂度
    ---

    似乎可以用 [势能分析法](https://yhx-12243.github.io/OI-transit/records/cf601E.html) 证明。其实本蒟蒻有一个很仙的想法。我们考虑这个双栈结构的整体复杂度。m 个事件,我们希望尽可能增加这个结构的复杂度。

@@ -126,11 +129,11 @@ $$
    T(m)=2\cdot O(m)+T\left(\frac{m}{2}\right)
    $$

解得 $T(m)=O(m)$ .
    解得 $T(m)=O(m)$ 

于是,总复杂度仍是 $O(mp)$ .
    于是,总复杂度仍是 $O(mp)$ 

### 询问操作
    ---

    在询问的时侯,我们要处理的应该是“在两个栈中选若干个元素的最大价值”的问题。因此要对栈顶的 DP 值做查询,即两个 $f,g$ 对于询问[l,r]的最大价值:

@@ -138,8 +141,9 @@ $$
    \max_{0\leq i<p}\left\{f[i]+\max_{l\leq i+j\leq r}g_j\right\}
    $$

这个问题暴力做是 $O(p^2)$ 的,不过一个妥妥的单调队列可以做到 $O(p)$ .
    这个问题暴力做是 $O(p^2)$ 的,不过一个妥妥的单调队列可以做到 $O(p)$ 

??? note "参考代码"
    ```cpp
    #include <algorithm>
    #include <cctype>
@@ -166,6 +170,7 @@ typedef pair<int, int> pii;
    /******************heading******************/
    const int M = 5e4 + 5, P = 505;
    int I, m, p;
    ```

    inline int _(int d) { return (d + p) % p; }
    namespace DQ {       // 双栈模拟双端队列
+1 −1
Original line number Diff line number Diff line
@@ -17,7 +17,7 @@

若 $G$ 为无向图,则 $E$ 中的每个元素为一个无序二元组 $(u, v)$ ,称作 **无向边 (Undirected edge)** ,简称 **边 (Edge)** ,其中 $u, v \in V$ 。设 $e = (u, v)$ ,则 $u$ 和 $v$ 称为 $e$ 的 **端点 (Endpoint)**

若 $G$ 为有向图,则 $E$ 中的每一个元素为一个有序二元组 $(u, v)$ ,有时也写作 $u \to v$ ,称作 **有向边 (Directed edge)****弧 (Arc)** ,在不引起混淆的情况下也可以称作 **边 (Edge)** 。设 $e = u \to v$ ,则此时 $u$ 称为 $e$ 的 **起点 (Tail)** , $v$ 称为 $e$ 的 **终点 (Head)** ,起点和终点也称为 $e$ 的 **端点 (Endpoint)** 。并称 $u$ 是 $v$ 的直接前驱, $v$ 是 $v$ 的直接后继。
若 $G$ 为有向图,则 $E$ 中的每一个元素为一个有序二元组 $(u, v)$ ,有时也写作 $u \to v$ ,称作 **有向边 (Directed edge)****弧 (Arc)** ,在不引起混淆的情况下也可以称作 **边 (Edge)** 。设 $e = u \to v$ ,则此时 $u$ 称为 $e$ 的 **起点 (Tail)** , $v$ 称为 $e$ 的 **终点 (Head)** ,起点和终点也称为 $e$ 的 **端点 (Endpoint)** 。并称 $u$ 是 $v$ 的直接前驱, $v$ 是 $u$ 的直接后继。

???+note "为什么起点是 Tail,终点是 Head?"
    边通常用箭头表示,而箭头是从“尾”指向“头”的。
Loading