Наиболее наивный подход к поиску простых чисел заключается в следующем. Будем брать по очереди натуральные числа , начиная с двойки, и проверять их на простоту. Проверка на простоту заключается в следующем: перебирая числа из диапазона от до , будем делить на с остатком. Если при каком-то обнаружится нулевой остаток, значит, делится на нацело, и число составное. Если же при делении обнаруживались только ненулевые остатки, значит, число простое; в этом случае выводим его на экран. Ясно, что, получив нулевой остаток (тем самым обнаружив, что составное), следует отказаться от дальнейших проб на делимость.
Заметим, что все простые числа, за исключением двойки, нечётные. Если обработать особо случай , то все последующие числа можно перебирать с шагом . Это даст приблизительно двукратное увеличение производительности программы.
Ещё одно улучшение возникает благодаря следующему утверждению: наименьший делитель составного числа не превосходит . Докажем это утверждение от противного. Пускай число является наименьшим делителем , причём . Тогда , где , причём , то есть также является делителем числа , кроме того, меньшим, чем , а это противоречит предположению. Всё это означает, что, перебирая потенциальные делители, можно оборвать перебор, когда достигнет : если до этого момента делителей не найдено, то их нет вообще. Кстати, при проверке на простоту числа это наблюдение позволяет сократить перебор более чем в три раза, а для числа — более чем в раза (оба числа — простые).
Существенно сократить перебор возможных делителей можно, пожертвовав памятью во время исполнения программы. В основе этой оптимизации лежит следующее утверждение: наименьший собственный делитель составного числа (то есть отличный от единицы и от самого ) является простым. Докажите самостоятельно.
Поскольку при проверке числа на простоту важен именно наименьший собственный делитель, делители следует искать среди простых чисел, перебирая их по порядку. Но где взять их список? Ответ прост: поскольку наша программа будет искать все простые числа по порядку, кроме вывода на экран будем добавлять их в список найденных простых. Для очередного будем перебирать потенциальные делители только из этого списка, по-прежнему, вплоть до .
Издержкой этого подхода является необходимость держать в памяти растущий список найденных простых чисел. Однако объём требуемой для этого памяти будет невелик по сравнению с громадным выигрышем в быстродействии. Следующая таблица даёт представление об экономии при переборе и о затратах памяти:
количество | количество простых | |
---|---|---|
Другой алгоритм поиска простых чисел приписывают древнегреческому учёному Эратосфену Киренскому (Έρατοσθένης).
Расположим числа от до в таблицу (решето) и зачеркнём сначала чётные числа, следующие после двойки. Двойку обведём. Затем найдём следующее после двойки незачёркнутое число (это будет тройка), обведём его, и зачеркнём каждое третье число после тройки (начиная с шести). После этого снова найдём первое после тройки незачёркнутое число (пятёрку), и после него зачеркнём каждое пятое (начиная с десяти). Будем повторять подобные действия, пока в таблице не останутся либо обведённые, либо зачёркнутые числа. Обведённые числа будут в точности простыми:
Обратите внимание: количество зачёркиваний у составного числа — это количество простых делителей (без учёта кратности).
Трюк, упомянутый в разделе «Наивный перебор», позволяет вдвое сократить список кандидатов в простые числа — заведомо составными будут все чётные числа кроме двойки. Посмотрим, нельзя ли подобным образом учесть ещё несколько первых простых чисел, чтобы дополнительно уменьшить число кандидатов.
Чисел, делящихся на — половина, а делящихся на — треть. Значит, доля чисел, делящихся хотя бы на одно из этих чисел, равна (вычитается доля чисел, делящихся и на , и на , иначе такие числа будут учтены дважды). Для интересной операции, которую мы только что выполнили над дробями и , введём обозначение: .
Очевидно, операция коммутативна: Кроме того, как нетрудно проверить, она ассоциативна:
Теперь ясно, что учёт следующего простого числа, пятёрки, увеличивает долю заведомо составных чисел (делящихся на , , ) до . Учёт семёрки даст . Интересно выяснить, какую выгоду можно получить, учитывая следующие простые числа, и каковы будут издержки.
Мы вычислили «суммы» обратных величин для первых простых чисел и свели результаты в таблицу:
Числа в правой колонке таблицы растут, но всё медленней.
Теперь перейдём к изложению сути колёсного метода. Метод позволяет быстро найти собственный делитель заданного числа или убедиться, что число простое. Возьмём первые простых чисел , , , . Их произведение называется примориалом числа . Затем найдём все числа от до , которые не делятся ни на одно из простых , , , (или, что в данном случае то же самое, взаимно простые с ). Все остальные числа от до или являются одним из , или составные. Кроме того, если к любому числу из тех, что мы назвали «все остальные», прибавить , , получится составное число. Действительно, любое из «остальных» чисел делится на какое-то , и то же самое можно сказать о . Их сумма тоже будет делиться на .
Список чисел от до , взаимно простых с , назовём колесом, а сами такие числа — спицами в колесе. Теперь мы знаем, что любое из простых чисел либо одно из , , , , либо содержится среди чисел вида , где — спица. Все остальные натуральные числа, кроме единицы, заведомо составные, и их доля, как показывает таблица, довольно велика даже для небольших .
Для проверки числа на простоту следует прежде всего поискать среди чисел , , , . Если поиск не увенчался успехом, проверяем по очереди, не делится ли на одно из . Если делится, число — составное. Если же нет, ищем делители среди спиц колеса (пропустив, естественно, единицу), затем среди чисел вида , затем среди чисел вида , затем — , и так продолжаем до тех пор, пока квадрат очередного делителя не превысит .
Построим колёса для первого одного простого числа, первых двух и первых трёх:
колесо | |
---|---|
, | |
, , , , , , , | |
, , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , |
Возьмём для примера колесо, построенное для двух первых простых чисел — и . Проверяя на простоту число при помощи такого колеса, убедившись, что не двойка и не тройка, пытаемся делить это число сначала на , , а затем — на , , , , , , , , , , то есть на числа из арифметических прогрессий и , . При имеет смысл остановиться на числе , поскольку квадрат следующего в списке, , уже больше . Теперь можно заключить, что число — простое.
Удобно изображать список возможных делителей в виде таблицы шириной (в нашем примере это ): Серые числа заведомо составные. Среди цветных чисел также могут встретиться, хоть и редко, составные числа (синие) — мы помним, что колёсный метод исключает не все составные числа из рассмотрения.
Для проверки того же числа на колесе, построенном для трёх первых простых чисел, нужно проверить его делимость сначала на , , , затем — на , , , , , .
Есть соблазн использовать для построения колеса как можно больше первых простых чисел. Но не стоит этого делать. Выигрыш с добавлением очередного простого числа будет всё меньше и меньше, а количество спиц в -ом колесе будет расти всё быстрее и быстрее. Можно показать, что количество спиц в -ом колесе равно Эта последовательность выглядит так: , , , , , , , , . Слишком большие колёса только замедлят выполнение программы, к тому же создание списка спиц потребует массу времени. Наши эксперименты показали, что оптимальное количество простых, используемых для построения колеса, равно четырём.
Ах, да. Почему метод называется колёсным? Возьмём колесо со спицами, пронумерованными от до , и удалим спицы с номерами, не взаимно простыми с . Если прокатить такое колесо по прямой, отмечая следы концов уцелевших спиц, на прямой останутся отметки, принадлежащие арифметическим прогрессиям вида . Первые три колеса показаны на рисунке 14.1. «Колёса для проверки чисел на простоту». Следующее колесо уже в семь раз больше самого крупного из показанных, и мы решили воздержаться от его рисования.
Разглядывание этих рисунков навело нас на следующие мысли:
Колёса симметричны относительно спиц с номерами и .
В колесе не бывает спиц с соседними номерами.
Если и — номера спиц, то — тоже номер спицы. Кроме того, если — номер спицы, то найдётся спица с номером таким, что . Математики сказали бы, что номера спиц образуют группу по отношению к операции умножения по модулю .
Предлагаем читателям поразмышлять над доказательствами этих утверждений.
Идеи для этого раздела мы нашли на странице The Prime Glossary: wheel factorization.
В разделе «Сравнение разных версий программы» приводятся результаты сравнительных испытаний всех пяти версий программы.
К задаче поиска простых чисел мы вернёмся в главе 32. «Поиск простых чисел с помощью регулярных выражений», где применим не совсем обычный подход: о простоте числа можно судить по тому, соответствует ли строка, состоящая из одинаковых символов, определённому шаблону.
Раздел «Простые числа: фильтрация» главы 38. «Объектно-ориентированное программирование» посвящён алгоритму поиска простых чисел, основанном на фильтрации. Постепенно строящаяся цепочка фильтров задерживает составные числа и пропускает простые. В чём-то этот алгоритм напоминает решето Эратосфена, но, строго говоря, не реализует настоящее решето.
В главе 39. «Битовая реализация числового множества» рассматривается другая реализация решета Эратосфена, гораздо более компактная, нежели массив с числами.