Итак, зададимся целью вычислить 1000000! (безо всяких приближений) за вменяемое время (порядка 1-2 минут). Предполагается, что работа с длинными числами встроена в язык, причём их умножение реализовано более-менее адекватно (ну хотя бы алгоритмом Карацубы). Далее в посте будет использоваться Ruby, в котором именно Карацуба и реализован.
Попытки посчитать "по определению" ни к чему толковому не приводят:
def factorial(n) r = 1 for i in 1..n do r *= i end return r end
user system total real 25000! 3.320000 0.060000 3.380000 ( 3.393819) 50000! 14.210000 0.190000 14.400000 ( 14.458802) 100000! 58.970000 0.870000 59.840000 ( 60.115690)Как видим, время ~ n2, хотя число множителей ~ n. Невесело как-то. Эдак 1000000! нам часа два ждать придётся...
А дело в том, что почти все операции — это умножение длинного числа на короткое, в то время как алгоритмы перемножения длинных чисел ведут себя лучше всего при перемножении чисел равной длины. Доказывать это теоретически мне лень, проще это на практике показать.
Чтобы сделать длины перемножаемых чисел примерно равными, поступим следующим образом. Заметим, что
Здесь оба сомножителя, как нетрудно понять, примерно равной длины. С каждым из них можно проделать тот же трюк. Получаем следующую рекурсивную реализацию:
def g(n, step) return n if n <= step return g(n, step*2) * g(n-step, step*2) end def factorial(n) g(n, 1) endНичего сложного в этом нет, а время выполнения улучшилось на порядок:
user system total real 25000! 0.330000 0.000000 0.330000 ( 0.365312) 50000! 1.030000 0.030000 1.060000 ( 1.098816) 100000! 3.560000 0.030000 3.590000 ( 3.666322)И в принципе, если лень заморачиваться, это вполне неплохой алгоритм. Тот самый 1000000! вычисляется за 4 с небольшим минуты.
Этот алгоритм можно ещё немножко ускорить, если заметить, что
, т.е. g(2n, 2) = 2n*g(n, 1). Вместо уймы умножений на 2 лучше накапливать степень двойки в отдельной переменной, а в конце сделать сдвиг влево на это значение:
class Factorial @shift = 0 def g(n, step) return n if n <= step if n.even? and step == 2 then @shift += n/2 return g(n/2, 1) end return g(n, step*2) * g(n-step, step*2) end def fac(n) @shift = 0 v = g(n, 1) return v << @shift end endОднако можно ускорить вычисление факториала ещё раза эдак в два! Но для этого нужно применять куда более хитрые методы.
(На этом вступление заканчивается ^____^)
Для начала вспомним, как возводить число в степень:
def power(a, p) return 1 if p.zero? t = power(a, p/2) ** 2 t *= a if p.odd? return t endПрименив совсем нехитрые соображения, мы уменьшили число умножений от O(n) до O(log n).
На похожей идее основан самый быстрый на сегодняшний день алгоритм вычисления факториала под названием PrimeSwing. Однако никакого описания алгоритма мне нагуглить не удалось (потому-то я и пишу всю эту муть, хе-хе).
Так вот, ключевая идея: будем вычислять n! как произведение двух сомножителей.
Первый:
— его вычислим рекурсивно.
Второй — соответственно всё остальное, т.е. , где
(U/L — целое, так как число сочетаний из 2(n div 2) по (n div 2) целое.)
Так что сосредоточимся на вычислении второго сомножителя. Предположим, что у нас имеется таблица простых чисел, меньших n (до миллиона она вычисляется за доли секунды). Рассмотрим все простые числа (с двойкой разберёмся отдельно, сдвинув полученный в конечном счёте факториал без двоек влево на ). Их можно разбить на несколько кусков и разбираться с ними по отдельности.
Случай 1: — ничего не поделать, придётся все такие p перемножать: все они встретятся в произведении ровно по одному разу. (Опять же, перемножать надо разумно.)
Случай 2: — все они среди сомножителей L, причём для любого такого p среди сомножителей U встречается 2p, но не встречается 3p, так что эти простые числа вообще сократятся, и их можно не рассматривать.
Случай 3: — поскольку среди чисел от 1 до n не встретится ни одного числа, делящегося на p2, степень p в разложении U/L на простые множители равна , что, как нетрудно показать, равняется либо 0, либо 1.
Случай 4: — сводится к 3-му случаю, только применять надо последовательно по отношению к p, p2, ...
Вот теперь код по вышеприведённой ссылке должен быть более-менее понятен.
Алгоритм, написанный на Ruby, вычислил 1000000! за 84 секунды. (UPD от 30.05.2011: в 1.9.3-dev появился Toom-Cook, и теперь время составляет 47 секунд. Круть!) Для сравнения: GMP, одна из самых скоростных библиотек для работы с числами такой величины, вычисляет это число за 7 секунд. Однако там, в отличие от Ruby, используются куда более хитрые методы для умножения длинных чисел, например, алгоритм Шёнхаге-Штрассена. Так что результат весьма неплох.
UPD от 31.07.2011: в связи с интересом общественности к данному посту решил выложить и свой код на Ruby — ещё один язык исполнения лишним не будет =)
https://gist.github.com/1116938
No comments:
Post a Comment