Исследователи, работавшие над проверкой закона Ципфа и его применением к объектам, не связанным с лингвистикой, обнаружили (http://www.physorg.com/news147353055.html), что приложения, создающиеся для Linux, так же подпадают под эту теорию.Закон Ципфа – это еще одно свидетельство того, что все в этом мире подчиняется единому порядку, проявления которого можно наблюдать в широком спектре, казалось бы, не связанных событий. Лингвист Георг Ципф в 1949 году эмпирическим путем установил, что распределение слов в книгах, газетах, журналах всегда следует одной и той же модели. В своей работе Ципф показал, что частота появления слов, например в книге, обратно пропорциональна его рангу. Другими словами, второе в списке самых часто употребляемых слов будет употребляться в 2 раза реже, чем первое. Соответственно, третье – в два раза реже, чем второе, и т.д.
Команда исследователей из Федерального Технологического института в Цюрихе решила проверить вышеописанную теорию на примере д...
URL: http://www.physorg.com/news147353055.html
Новость: http://www.opennet.me/opennews/art.shtml?num=19193
они бы еще число уязвимостей посчитали :)
А что классно было бы, если б число уязвимостей подчиналось какому-то закону, тогда б при разработке кода заранее было б известно, что нужно обнаружить столько-то дырок. :)
> А что классно было бы, если б число уязвимостей подчиналось какому-то закону, тогда б при разработке
> кода заранее было б известно, что нужно обнаружить столько-то дырок. :)Исследования показывают, что в программном обеспечении в среднем содержится от одной до шестнадцати ошибок на тысячу строк кода [27, 22, 2] ..... В [22] показано, что число ошибок на тысячу строк кода стремится к стабилизации по мере роста числа выпущенных версий, но асимптотически этот показатель отличается от нуля.
Надо так: "Линус подчиняется Ципсу"
че-то какие-то сферические кони в вакууме. какие практические выводы можно сделать из этого исследования?
Что количество зависимостей в среднем растет, причем по некоторому закону. Это же статистика.
>че-то какие-то сферические кони в вакууме. какие практические выводы можно сделать из этого исследования?То что развитие свободного программного обеспечения описывается математическими законами, следствено: есть возможность построить математическую модель развития СПО, со всеми вытекающими вкусностями, такими как прогнозирвание развития и управление развитием.
есть вещи не несущие практической выгоды =)
эта красота цифр, как средство для медитации - взять в уме корень квадратный зависимостей пакета от его ранга... оммммгггггг гыгыгы =)
Исследователи долго сравнивали md5-хеши man-страниц и пришли к выводу что их исследования нафиг не нужны для чтения man-страниц.
А вроде опечатка -- четвертое слово, а не третье должно реже встречаться чем второе в два раза. В оригинальном тескте статьи вроде так написано. А если верить русской википедии, то можно и так сказать -- второе слово в два раза реже, третье в три чем первое (четвертое в четыре чем первое и в два раза реже чем второе) -- так я думаю нагляднее.
А закон Ципфа забавный...
> А закон Ципфа забавный...Стопудово. Не знаю как остальным, а мне вот это кажется математической банальностью типа как "если к числу a прибавить положительное число b , то результат c будет больше чем a":
> если пакеты расположить в порядке возрастания числа их зависимостей, то для конкретного пакета это число будет прямо пропорционально его порядковому номеру
+1 Тоже это заметил.)))
И что тут банального?
> если пакеты расположить в порядке возрастания числа их зависимостей, то для конкретного пакета это число будет прямо пропорционально его порядковому номеруВедь могла бы быть и квадратичная зависимость или квадратный корень, например.
Где тут такие прям очевидные вещи говорят?
>И что тут банального?
>> если пакеты расположить в порядке возрастания числа их зависимостей, то для конкретного пакета это число будет прямо пропорционально его порядковому номеру
>
>Ведь могла бы быть и квадратичная зависимость или квадратный корень, например.
>Где тут такие прям очевидные вещи говорят?+1
вот это да! связи промеж пакетов дебиана подчиняются мат. модели. а если нарисовать картинку - получается гипербола (Гена! она такая красивая!(с))зы сейчас отсортировал логи, построил графики - количество обращений юзверей к различным нфс експортам и смб шАрам имеет идентичное распределение. таки прав тов. Ципф и его последователи, линух целиком и полностью следует его теории.
Закон Ципфа нащупывает часть общевселенской меры, чем не лишний раз подтверждает связность всего и вся.Изучайте Концепцию общественной безопасности
google:// petrov lessons
Важность слов, какая-то зависимость от какого-то периода времени. Что за порядковый номер пакета? О чём речь, не понятно.
Плохо вы учили статистику.
Есть ложь, большая ложь, и статистика.
смеялся до упаду :-)
решил провести свой эксперемент по поиску слов в гугле результат
windows 1080x10^6
linux 399x10^6
Solaris 45x10^6
BSD 40x10^6мой вывод по закону Ципа: можно сказать что самая популярная ОС это винды, вторая по популярности линукс ( учитывая погрешность :-) ) а вот 3-ю и 4-ю по популярности я просто не знаю :-) ведь для них цифры должны быть 200x10^6, 100х10^6 соответсвенно :-)
Это не популярность а количество страниц в индексе гугла, в которых встречаются данные слова (N). Задача на дом - вычислить зависимость N от популярности ОС (P).
Mac OS - 145*10^6 :)
Поиск также спецефическая вещь:
http://www.google.com/search?client=opera&rls=en&q=Mac+OS&so...
Результаты 1 - 10 из примерно 134 000 000 для Mac OS. (0,27 секунд) == 134 * 10^6
У Вас было : Mac OS - 145*10^6 :)
За одни сутки пропало из индекса Google - 11 * 10^6 страниц...
эх, взяли и удалили. про зависимости прочел. sqrt(time) = count и так в среднем для всех пакетов. (тут следует не хорошее слово) в общем:D
была раньше такая развлекаловка, нумерология называлась. смысл ее сводился к тому, что путем несложных (сложные разработчикам были недоступны) операций над всем на свете выискивались аналогии в численном представлении, и на этом основании делались выводы, космического масштаба и космической же глупости.смысл исследования - только тот факт что произвольно взятое явление можно исследовать статистически...
>Над его созданием трудятся более 1000 добровольцев со всего мира,
>и если в начале 1996 года в дистрибутив входило 474 пакетов,
>то сейчас их более 18 тыс.а все так же глючит lol
>>Над его созданием трудятся более 1000 добровольцев со всего мира,
>>и если в начале 1996 года в дистрибутив входило 474 пакетов,
>>то сейчас их более 18 тыс.
>
>а все так же глючит lolДо неприличного толсто. Ошибки в стабильной ветке Debian постоянно вылавливают, а новых не добавляют, в этом и заключается суть настоящей стабильности. Стабильный Debian не глючит настолько, что заявлять о его глючности - это просто верх наглости.
За пару тысячелетий придумано столько законов и теорем, что любая деятельность человека
и вообще природы, какой-нибудь закон, но описывает.
Если бы определили, что развитие Linux подчиняется закону роста бурых водорослей или
бактерий с сортире, всё бы были счастливы до усрачки, особенно янки, им за это медали
дают, и ходили бы гордые, как, мля, они умеют исследовать!
Во, придумал...Если код Linux обработать только препроцессором, без компиляции,
то все зарезервированые слова языка C, будут подчинятся закону
нормального расспределения, то есть Закону Гаусса!!!Все, мля, я вумный, дай мне медаль имени MAX_INT-летия парижской коммуны!!
лучше бы код писали, чесслово...
В новости повторяются слова так14 в
5 и
4 что
4 его
3 Debian
3 более
3 для
3 зависимостей
3 можно
3 слов
2 Ципфа
2 числа
2 чем
2 этомВот тема новости,
- Что в Дебиан числа, слов для более зависимостей, чем можно в этом, его Ципфа :)
или
- Для дебиан зависимостей более, чем этом слов, и что, и его Ципфа числа можно... :)
>+ сто пицотТак сто или "пицот"? Или это так теперь принято записывать число 600?