Глава 14. Поиск простых чисел

Идеи реализации
	Глава 14. Поиск простых чисел

Идеи реализации

$n$	количество $k ⩽ \sqrt{n}$	количество простых $k ⩽ \sqrt{n}$
$10$	$3$	$1$
$100$	$10$	$4$
$1000$	$31$	$10$
$10000$	$100$	$25$
$100000$	$316$	$65$
$1000000$	$1000$	$168$

Решето Эратосфена

Другой алгоритм поиска простых чисел приписывают древнегреческому учёному Эратосфену Киренскому (Έρατοσθένης).

Расположим числа от $2$ до $n$ в таблицу (решето) и зачеркнём сначала чётные числа, следующие после двойки. Двойку обведём. Затем найдём следующее после двойки незачёркнутое число (это будет тройка), обведём его, и зачеркнём каждое третье число после тройки (начиная с шести). После этого снова найдём первое после тройки незачёркнутое число (пятёрку), и после него зачеркнём каждое пятое (начиная с десяти). Будем повторять подобные действия, пока в таблице не останутся либо обведённые, либо зачёркнутые числа. Обведённые числа будут в точности простыми: $\begin{matrix} 2 & 3 & 4' & 5 & 6 ″ & 7 & 8' & 9' & 10 ″ \\ 11 & 12 ″ & 13 & 14 ″ & 15 ″ & 16' & 17 & 18 ″ & 19 & 20 ″ \\ 21 ″ & 22 ″ & 23 & 24 ″ & 25' & 26 ″ & 27' & 28 ″ & 29 & 30 ‴ \\ 31 & 32' & 33 ″ & 34 ″ & 35 ″ & 36 ″ & 37 & 38 ″ & 39 ″ & 40 ″ \\ 41 & 42 ‴ & 43 & 44 ″ & 45 ″ & 46 ″ & 47 & 48 ″ & 49' & 50 ″ \\ 51 ″ & 52 ″ & 53 & 54 ″ & 55 ″ & 56 ″ & 57 ″ & 58 ″ & 59 & 60 ‴ \\ 61 & 62 ″ & 63 ″ & 64' & 65 ″ & 66 ‴ & 67 & 68 ″ & 69 ″ & 70 ‴ \\ 71 & 72 ″ & 73 & 74 ″ & 75 ″ & 76 ″ & 77 ″ & 78 ‴ & 79 & 80 ″ \\ 81' & 82 ″ & 83 & 84 ‴ & 85 ″ & 86 ″ & 87 ″ & 88 ″ & 89 & 90 ‴ \\ 91 ″ & 92 ″ & 93 ″ & 94 ″ & 95 ″ & 96 ″ & 97 & 98 ″ & 99 ″ & 100 ‴ \end{matrix}$

Обратите внимание: количество зачёркиваний у составного числа — это количество простых делителей (без учёта кратности).

Трюк, упомянутый в разделе «Наивный перебор», позволяет вдвое сократить список кандидатов в простые числа — заведомо составными будут все чётные числа кроме двойки. Посмотрим, нельзя ли подобным образом учесть ещё несколько первых простых чисел, чтобы дополнительно уменьшить число кандидатов.

Чисел, делящихся на $2$ — половина, а делящихся на $3$ — треть. Значит, доля чисел, делящихся хотя бы на одно из этих чисел, равна $\frac{1}{2} + \frac{1}{3} - \frac{1}{2} \cdot \frac{1}{3} = \frac{2}{3}$ (вычитается доля чисел, делящихся и на $2$ , и на $3$ , иначе такие числа будут учтены дважды). Для интересной операции, которую мы только что выполнили над дробями $\frac{1}{2}$ и $\frac{1}{3}$ , введём обозначение: $x \oplus y = x + y - x y$ .

Очевидно, операция $\oplus$ коммутативна: $x \oplus y = y \oplus x .$ Кроме того, как нетрудно проверить, она ассоциативна: $(x \oplus y) \oplus z = x \oplus (y \oplus z) .$

Теперь ясно, что учёт следующего простого числа, пятёрки, увеличивает долю заведомо составных чисел (делящихся на $2$ , $3$ , $5$ ) до $\frac{1}{2} \oplus \frac{1}{3} \oplus \frac{1}{5} = \frac{11}{15}$ . Учёт семёрки даст $\frac{1}{2} \oplus \frac{1}{3} \oplus \frac{1}{5} \oplus \frac{1}{7} = \frac{11}{15} \oplus \frac{1}{7} = \frac{27}{35}$ . Интересно выяснить, какую выгоду можно получить, учитывая следующие простые числа, и каковы будут издержки.

Мы вычислили «суммы» обратных величин для первых $k$ простых чисел и свели результаты в таблицу:

$k$	$\frac{1}{2} \oplus \frac{1}{3} \oplus \frac{1}{5} \oplus \dots \oplus \frac{1}{p_{k}}$
$1$	$0,5000…$
$2$	$0,6667…$
$3$	$0,7333…$
$4$	$0,7714…$
$5$	$0,7922…$
$6$	$0,8082…$
$7$	$0,8195…$
$8$	$0,8290…$
$9$	$0,8364…$
$10$	$0,8421…$

Числа в правой колонке таблицы растут, но всё медленней.

Теперь перейдём к изложению сути колёсного метода. Метод позволяет быстро найти собственный делитель заданного числа или убедиться, что число простое. Возьмём первые $k$ простых чисел $p_{1}$ , $p_{2}$ , $\dots$ , $p_{k}$ . Их произведение $P_{k} = p_{1} p_{2} \dots p_{k}$ называется примориалом числа $k$ . Затем найдём все числа от $1$ до $P_{k}$ , которые не делятся ни на одно из простых $p_{1}$ , $p_{2}$ , $\dots$ , $p_{k}$ (или, что в данном случае то же самое, взаимно простые с $P_{k}$ ). Все остальные числа от $1$ до $P_{k}$ или являются одним из $p_{i}$ , или составные. Кроме того, если к любому числу из тех, что мы назвали «все остальные», прибавить $n P_{k}$ , $n \in ℕ$ , получится составное число. Действительно, любое из «остальных» чисел делится на какое-то $p_{i}$ , и то же самое можно сказать о $n P_{k}$ . Их сумма тоже будет делиться на $p_{i}$ .

Список чисел от $1$ до $P_{k}$ , взаимно простых с $P_{k}$ , назовём колесом, а сами такие числа — спицами в колесе. Теперь мы знаем, что любое из простых чисел либо одно из $p_{1}$ , $p_{2}$ , $\dots$ , $p_{k}$ , либо содержится среди чисел вида $s + n P_{k}$ , где $s$ — спица. Все остальные натуральные числа, кроме единицы, заведомо составные, и их доля, как показывает таблица, довольно велика даже для небольших $k$ .

Для проверки числа $N$ на простоту следует прежде всего поискать $N$ среди чисел $p_{1}$ , $p_{2}$ , $\dots$ , $p_{k}$ . Если поиск не увенчался успехом, проверяем по очереди, не делится ли $N$ на одно из $p_{i}$ . Если делится, число $N$ — составное. Если же нет, ищем делители $N$ среди спиц колеса $s$ (пропустив, естественно, единицу), затем среди чисел вида $s + P_{k}$ , затем среди чисел вида $s + 2 P_{k}$ , затем — $s + 3 P_{k}$ , и так продолжаем до тех пор, пока квадрат очередного делителя не превысит $N$ .

Построим колёса для первого одного простого числа, первых двух и первых трёх:

$k$	колесо
$1$	$1$
$2$	$1$ , $5$
$3$	$1$ , $7$ , $11$ , $13$ , $17$ , $19$ , $23$ , $29$
$4$	$1$ , $11$ , $13$ , $17$ , $19$ , $23$ , $29$ , $31$ , $37$ , $41$ , $43$ , $47$ , $53$ , $59$ , $61$ , $67$ , $71$ , $73$ , $79$ , $83$ , $89$ , $97$ , $101$ , $103$ , $107$ , $109$ , $113$ , $121$ , $127$ , $131$ , $137$ , $139$ , $143$ , $149$ , $151$ , $157$ , $163$ , $167$ , $169$ , $173$ , $179$ , $181$ , $187$ , $191$ , $193$ , $197$ , $199$ , $209$

Возьмём для примера колесо, построенное для двух первых простых чисел — $2$ и $3$ . Проверяя на простоту число $N$ при помощи такого колеса, убедившись, что $N$ не двойка и не тройка, пытаемся делить это число сначала на $2$ , $3$ , а затем — на $5$ , $7$ , $11$ , $13$ , $17$ , $19$ , $23$ , $25$ , $29$ , $\dots$ , то есть на числа из арифметических прогрессий $1 + 6 t$ и $5 + 6 t$ , $t = 0, 1, 2, 3, \dots$ . При $N = 661$ имеет смысл остановиться на числе $25$ , поскольку квадрат следующего в списке, $29$ , уже больше $661$ . Теперь можно заключить, что число $661$ — простое.

Удобно изображать список возможных делителей в виде таблицы шириной $P_{k}$ (в нашем примере это $2 ⋅ 3 = 6$ ): $\begin{matrix} 2 & 3 & 4 & 5 & 6 \\ 7 & 8 & 9 & 10 & 11 & 12 \\ 13 & 14 & 15 & 16 & 17 & 18 \\ 19 & 20 & 21 & 22 & 23 & 24 \\ 25 & 26 & 27 & 28 & 29 & 30 \\ 31 & 32 & 33 & 34 & 35 & 36 \\ 37 & 38 & 39 & 40 & 41 & 42 \\ 43 & 44 & 45 & 46 & 47 & 48 \\ \dots \end{matrix}$ Серые числа заведомо составные. Среди цветных чисел также могут встретиться, хоть и редко, составные числа (синие) — мы помним, что колёсный метод исключает не все составные числа из рассмотрения.

Для проверки того же числа $661$ на колесе, построенном для трёх первых простых чисел, нужно проверить его делимость сначала на $2$ , $3$ , $5$ , затем — на $7$ , $11$ , $13$ , $17$ , $19$ , $23$ .

Есть соблазн использовать для построения колеса как можно больше первых простых чисел. Но не стоит этого делать. Выигрыш с добавлением очередного простого числа будет всё меньше и меньше, а количество спиц в $k$ -ом колесе будет расти всё быстрее и быстрее. Можно показать, что количество спиц в $k$ -ом колесе равно $(p_{1} - 1) (p_{2} - 1) (p_{3} - 1) \cdot \dots \cdot (p_{k} - 1) .$ Эта последовательность выглядит так: $1$ , $2$ , $8$ , $48$ , $480$ , $5760$ , $92160$ , $1658880$ , $\dots$ . Слишком большие колёса только замедлят выполнение программы, к тому же создание списка спиц потребует массу времени. Наши эксперименты показали, что оптимальное количество простых, используемых для построения колеса, равно четырём.

Ах, да. Почему метод называется колёсным? Возьмём колесо со спицами, пронумерованными от $1$ до $P_{k}$ , и удалим спицы с номерами, не взаимно простыми с $P_{k}$ . Если прокатить такое колесо по прямой, отмечая следы концов уцелевших спиц, на прямой останутся отметки, принадлежащие арифметическим прогрессиям вида $s + P_{k} t$ . Первые три колеса показаны на рисунке 14.1. «Колёса для проверки чисел на простоту». Следующее колесо уже в семь раз больше самого крупного из показанных, и мы решили воздержаться от его рисования.

Рисунок 14.1. Колёса для проверки чисел на простоту

Разглядывание этих рисунков навело нас на следующие мысли:

Колёса симметричны относительно спиц с номерами $P_{k}$ и $\frac{P_{k}}{2}$ .

В колесе не бывает спиц с соседними номерами.

Если $u$ и $v$ — номера спиц, то $u v mod P_{k}$ — тоже номер спицы. Кроме того, если $u$ — номер спицы, то найдётся спица с номером $v$ таким, что $u v mod P_{k} = 1$ . Математики сказали бы, что номера спиц образуют группу по отношению к операции умножения по модулю $P_{k}$ .

Предлагаем читателям поразмышлять над доказательствами этих утверждений.

Идеи для этого раздела мы нашли на странице The Prime Glossary: wheel factorization.

Замечания

В разделе «Сравнение разных версий программы» приводятся результаты сравнительных испытаний всех пяти версий программы.

К задаче поиска простых чисел мы вернёмся в главе 32. «Поиск простых чисел с помощью регулярных выражений», где применим не совсем обычный подход: о простоте числа $k$ можно судить по тому, соответствует ли строка, состоящая из $k$ одинаковых символов, определённому шаблону.

Раздел «Простые числа: фильтрация» главы 38. «Объектно-ориентированное программирование» посвящён алгоритму поиска простых чисел, основанном на фильтрации. Постепенно строящаяся цепочка фильтров задерживает составные числа и пропускает простые. В чём-то этот алгоритм напоминает решето Эратосфена, но, строго говоря, не реализует настоящее решето.

В главе 39. «Битовая реализация числового множества» рассматривается другая реализация решета Эратосфена, гораздо более компактная, нежели массив с числами.


Глава 14. Поиск простых чисел		Разработка

Идеи реализации

Наивный перебор

Оптимизированный перебор делителей

Перебор с запоминанием найденных простых чисел

Решето Эратосфена

Колёсный метод

Замечания