Это напоминает мне вероятностный расчёт невозможности появления жизни на земле. Там просто берется и рассчитывается вероятность повторения среднего фермента "аминокислота к аминокислоте". Естественно это неправильно, поскольку фермент работает (не всегда даже снижая свою эффективность) и при отклонениях в последовательности аминокислот его составляющих, главное что бы активный центр остался с точки зрения участников реакции тем же.Столько сколько Вы подсчитали по объему, столько просто не существует текстов, и вполне возможно, даже не было произнесено вообще за всю историю конкретного языка.
В Вашем примере достаточно заменить предложение на предложение из предлогов-местоимений-глаголов и подставленных абстрактных "существительных" и "прилагательных". А для Существительных и Глаголов завести таблицу частоты совместной встречи в одном предложении и в соседнем.
Число комбинаций сократится существенно.
А если еще не пытаться генерировать все возможные порядки слов, а посмотреть на базе реально существующих текстов, то и получится тот самый статистический способ перевода :)