The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

Развитие Linux подчиняется закону распределения Ципфа

03.12.2008 12:02

Исследователи, работавшие над проверкой закона Ципфа и его применением к объектам, не связанным с лингвистикой, обнаружили, что приложения, создающиеся для Linux, так же подпадают под эту теорию.

Закон Ципфа – это еще одно свидетельство того, что все в этом мире подчиняется единому порядку, проявления которого можно наблюдать в широком спектре, казалось бы, не связанных событий. Лингвист Георг Ципф в 1949 году эмпирическим путем установил, что распределение слов в книгах, газетах, журналах всегда следует одной и той же модели. В своей работе Ципф показал, что частота появления слов, например в книге, обратно пропорциональна его рангу. Другими словами, второе в списке самых часто употребляемых слов будет употребляться в 2 раза реже, чем первое. Соответственно, четвертое – в два раза реже, чем второе, и т.д.

Команда исследователей из Федерального Технологического института в Цюрихе решила проверить вышеописанную теорию на примере дистрибутива Debian Linux. Над его созданием трудятся более 1000 добровольцев со всего мира, и если в начале 1996 года в дистрибутив входило 474 пакетов, то сейчас их более 18 тыс. Как объяснили участники эксперимента, экосистема Linux-дистрибутивов постоянно меняется: появляются новые пакеты, старые исчезают. В этом можно проследить аналогию со словами в языке. И эта аналогия была подтверждена практически, только вместо частоты употребления слов учеными использовались данные о количестве зависимостей у входящих в Debian пакетов.

Используя имеющиеся данные по Debian Linux, исследователи вывели следующую закономерность: если пакеты расположить в порядке возрастания числа их зависимостей, то для конкретного пакета это число будет прямо пропорционально его порядковому номеру. В добавление к этому, средний прирост числа зависимостей для выбранного пакета является функцией квадратного корня от времени, а увеличение зависимостей за период времени пропорционально этому периоду.

С этим и другими выводами ученых более подробно можно ознакомиться, прочитав следующее издание: T. Maillart.; D. Sornette; S. Spaeth, and G. von Krogh. “Empircal Tests of Zipf’s Law Mechanism in Open Source Linux Distribution.” Physical Review Letters 101 218701 (2008).

  1. Главная ссылка к новости (http://www.physorg.com/news147...)
Автор новости: blkdog
Лицензия: CC BY 3.0
Короткая ссылка: https://opennet.ru/19193-opensource
Ключевые слова: opensource, linux
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (33) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.1, sluge (??), 13:16, 03/12/2008 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    они бы еще число уязвимостей посчитали :)
     
     
  • 2.3, Султан (?), 13:27, 03/12/2008 [^] [^^] [^^^] [ответить]  
  • +/
    А что классно было бы, если б число уязвимостей подчиналось какому-то закону, тогда б при разработке кода заранее было б известно, что нужно обнаружить столько-то дырок. :)
     
     
  • 3.23, andr.mobi (??), 16:43, 03/12/2008 [^] [^^] [^^^] [ответить]  
  • +/
    > А что классно было бы, если б число уязвимостей подчиналось какому-то закону, тогда б при разработке
    > кода заранее было б известно, что нужно обнаружить столько-то дырок. :)

    Исследования показывают, что в программном обеспечении в среднем содержится от одной до шестнадцати ошибок на тысячу строк кода [27, 22, 2] ..... В [22] показано, что число ошибок на тысячу строк кода стремится к стабилизации по мере роста числа выпущенных версий, но асимптотически этот показатель отличается от нуля.

    Источник http://www.minix3.ru/articles/reliable-os.html

     

  • 1.2, Аноним (2), 13:26, 03/12/2008 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Надо так: "Линус подчиняется Ципсу"
     
  • 1.4, fresco (??), 13:28, 03/12/2008 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    че-то какие-то сферические кони в вакууме. какие практические выводы можно сделать из этого исследования?
     
     
  • 2.6, Алексей (??), 13:38, 03/12/2008 [^] [^^] [^^^] [ответить]  
  • +/
    Что количество зависимостей в среднем растет, причем по некоторому закону. Это же статистика.
     
  • 2.7, Аноним (-), 13:54, 03/12/2008 [^] [^^] [^^^] [ответить]  
  • +/
    >че-то какие-то сферические кони в вакууме. какие практические выводы можно сделать из этого исследования?

    То что развитие свободного программного обеспечения описывается математическими законами, следствено: есть возможность построить математическую модель развития СПО, со всеми вытекающими вкусностями, такими как прогнозирвание развития и управление развитием.

     
  • 2.9, uRrrr (?), 13:58, 03/12/2008 [^] [^^] [^^^] [ответить]  
  • +/
    есть вещи не несущие практической выгоды =)
    эта красота цифр, как средство для медитации - взять в уме корень квадратный зависимостей пакета от его ранга... оммммгггггг гыгыгы =)
     

  • 1.5, Аноним (5), 13:34, 03/12/2008 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Исследователи долго сравнивали md5-хеши man-страниц и пришли к выводу что их исследования нафиг не нужны для чтения man-страниц.
     
     
  • 2.8, aurved (?), 13:57, 03/12/2008 [^] [^^] [^^^] [ответить]  
  • +/
    А вроде опечатка -- четвертое слово, а не третье должно реже встречаться чем второе в два раза. В оригинальном тескте статьи вроде так написано. А если верить русской википедии, то можно и так сказать -- второе слово в два раза реже, третье в три чем первое (четвертое в четыре чем первое и в два раза реже чем второе) -- так я думаю нагляднее.
     

  • 1.10, aurved (?), 14:01, 03/12/2008 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    А закон Ципфа забавный...


     
     
  • 2.18, Ivan (??), 15:10, 03/12/2008 [^] [^^] [^^^] [ответить]  
  • +/
    > А закон Ципфа забавный...

    Стопудово. Не знаю как остальным, а мне вот это кажется математической банальностью типа как "если к числу a прибавить положительное число b , то результат c будет больше чем a":

    > если пакеты расположить в порядке возрастания числа их зависимостей, то для конкретного пакета это число будет прямо пропорционально его порядковому номеру

     
     
  • 3.25, Quake (?), 16:56, 03/12/2008 [^] [^^] [^^^] [ответить]  
  • +/
    +1 Тоже это заметил.)))
     
  • 3.29, Аноним (2), 18:44, 03/12/2008 [^] [^^] [^^^] [ответить]  
  • +/
    И что тут банального?
    > если пакеты расположить в порядке возрастания числа их зависимостей, то для конкретного пакета это число будет прямо пропорционально его порядковому номеру

    Ведь могла бы быть и квадратичная зависимость или квадратный корень, например.
    Где тут такие прям очевидные вещи говорят?

     
     
  • 4.38, s_dog (??), 21:09, 04/12/2008 [^] [^^] [^^^] [ответить]  
  • +/
    >И что тут банального?
    >> если пакеты расположить в порядке возрастания числа их зависимостей, то для конкретного пакета это число будет прямо пропорционально его порядковому номеру
    >
    >Ведь могла бы быть и квадратичная зависимость или квадратный корень, например.
    >Где тут такие прям очевидные вещи говорят?

    +1

     

  • 1.14, Chinese (??), 14:56, 03/12/2008 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    вот это да! связи промеж пакетов дебиана подчиняются мат. модели. а если нарисовать картинку - получается гипербола (Гена! она такая красивая!(с))

    зы сейчас отсортировал логи, построил графики - количество обращений юзверей к различным нфс експортам и смб шАрам имеет идентичное распределение. таки прав тов. Ципф и его последователи, линух целиком и полностью следует его теории.

     
  • 1.15, Nick (??), 14:57, 03/12/2008 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Закон Ципфа нащупывает часть общевселенской меры, чем не лишний раз подтверждает связность всего и вся.

    Изучайте Концепцию общественной безопасности
    google:// petrov lessons

     
  • 1.16, skyogre (?), 15:05, 03/12/2008 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Важность слов, какая-то зависимость от какого-то периода времени. Что за порядковый номер пакета? О чём речь, не понятно.
     
     
  • 2.19, fantom (??), 15:39, 03/12/2008 [^] [^^] [^^^] [ответить]  
  • +/
    Плохо вы учили статистику.
     
     
  • 3.24, Аноним (2), 16:46, 03/12/2008 [^] [^^] [^^^] [ответить]  
  • +/
    Есть ложь, большая ложь, и статистика.
     

  • 1.20, ТТТ (?), 16:03, 03/12/2008 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    смеялся до упаду :-)
    решил провести свой эксперемент по поиску слов в гугле результат
    windows   1080x10^6
    linux             399x10^6
    Solaris           45x10^6
    BSD               40x10^6

    мой вывод по закону Ципа: можно сказать что самая популярная ОС это винды, вторая по популярности линукс ( учитывая погрешность :-) ) а вот 3-ю и 4-ю по популярности я просто не знаю :-) ведь для них цифры должны быть 200x10^6,  100х10^6 соответсвенно :-)

     
     
  • 2.22, Лше (?), 16:40, 03/12/2008 [^] [^^] [^^^] [ответить]  
  • +/
    Это не популярность а количество страниц в индексе гугла, в которых встречаются данные слова (N). Задача на дом - вычислить зависимость N от популярности ОС (P).
     
  • 2.28, Роман (??), 18:05, 03/12/2008 [^] [^^] [^^^] [ответить]  
  • +/
    Mac OS - 145*10^6 :)
     
     
  • 3.39, Ан (??), 00:13, 05/12/2008 [^] [^^] [^^^] [ответить]  
  • +/
    Поиск также спецефическая вещь:
    http://www.google.com/search?client=opera&rls=en&q=Mac+OS&sourceid=opera&ie=u
    Результаты 1 - 10 из примерно 134 000 000 для Mac OS. (0,27 секунд) == 134 * 10^6
    У Вас было : Mac OS - 145*10^6 :)
    За одни сутки пропало из индекса Google - 11 * 10^6 страниц...
     

  • 1.21, Аноним (2), 16:15, 03/12/2008 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    эх, взяли и удалили. про зависимости прочел. sqrt(time) = count и так в среднем для всех пакетов. (тут следует не хорошее слово) в общем:D
     
  • 1.26, Square (ok), 17:02, 03/12/2008 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    была раньше такая развлекаловка, нумерология называлась. смысл ее сводился к тому, что путем несложных (сложные разработчикам были недоступны) операций над всем на свете выискивались аналогии в численном представлении, и на этом основании делались выводы, космического масштаба и космической же глупости.

    смысл исследования - только тот факт что произвольно взятое явление можно исследовать статистически...

     
  • 1.27, Аноним (5), 18:01, 03/12/2008 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    >Над его созданием трудятся более 1000 добровольцев со всего мира,
    >и если в начале 1996 года в дистрибутив входило 474 пакетов,
    >то сейчас их более 18 тыс.

    а все так же глючит lol

     
     
  • 2.36, www2 (??), 09:11, 04/12/2008 [^] [^^] [^^^] [ответить]  
  • +/
    >>Над его созданием трудятся более 1000 добровольцев со всего мира,
    >>и если в начале 1996 года в дистрибутив входило 474 пакетов,
    >>то сейчас их более 18 тыс.
    >
    >а все так же глючит lol

    До неприличного толсто. Ошибки в стабильной ветке Debian постоянно вылавливают, а новых не добавляют, в этом и заключается суть настоящей стабильности. Стабильный Debian не глючит настолько, что заявлять о его глючности - это просто верх наглости.

     

  • 1.30, pavlinux (ok), 21:15, 03/12/2008 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
      За пару тысячелетий придумано столько законов и теорем, что любая деятельность человека
    и вообще природы, какой-нибудь закон, но описывает.
      Если бы определили, что развитие Linux подчиняется закону роста бурых водорослей или
    бактерий с сортире, всё бы были счастливы до усрачки, особенно янки, им за это медали
    дают, и ходили бы гордые, как, мля, они умеют исследовать!


     
  • 1.31, pavlinux (ok), 21:27, 03/12/2008 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Во, придумал...

    Если код Linux обработать только препроцессором, без компиляции,
    то все зарезервированые слова языка C, будут подчинятся закону
    нормального расспределения, то есть Закону Гаусса!!!

    Все, мля, я вумный, дай мне медаль имени MAX_INT-летия парижской коммуны!!

      

     
  • 1.32, yason (?), 23:26, 03/12/2008 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    лучше бы код писали, чесслово...
     
  • 1.33, pavlinux (ok), 00:12, 04/12/2008 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    В новости повторяются слова так

    14 в
    5 и
    4 что
    4 его
    3 Debian
    3 более
    3 для
    3 зависимостей
    3 можно
    3 слов
    2 Ципфа
    2 числа
    2 чем
    2 этом

    Вот тема новости,

    - Что в Дебиан числа, слов для более зависимостей, чем можно в этом, его Ципфа :)
    или
    - Для дебиан зависимостей более, чем этом слов, и что, и  его Ципфа числа можно... :)

     
     
     
    Часть нити удалена модератором

  • 3.37, www2 (??), 09:14, 04/12/2008 [^] [^^] [^^^] [ответить]  
  • +/
    >+ сто пицот

    Так сто или "пицот"? Или это так теперь принято записывать число 600?

     

     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2024 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру