The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

Оценка объема ругательств в текстах коммитов для различных языков программирования

23.02.2011 09:45

Эндрю Воз (Andrew Vos) провел интересное исследование, заключающееся в анализе частоты использования ненормативной лексики, грубых выражений и ругательств в текстах примечаний к Git-коммитам на GitHub, в привязке к различным языкам программирования. Всего было проанализировано около миллиона коммитов, в которых было выявлено 210 ругательных слов. Лидируют по числу ругательств C++, JavaScript и Ruby.

Представленные на диаграмме показатели не зависят от популярности языков, так как выборка была сформирована из эквивалентных по размеру случайных наборов коммитов.

  1. Главная ссылка к новости (http://andrewvos.com/2011/02/2...)
  2. OpenNews: "Пасхальные яйца" в популярных свободных программах
  3. OpenNews: Анализ странных вещей в исходном коде FreeBSD и Linux.
Лицензия: CC BY 3.0
Короткая ссылка: https://opennet.ru/29685-lang
Ключевые слова: lang, statistic
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (41) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.4, Аноним (-), 10:34, 23/02/2011 [ответить] [﹢﹢﹢] [ · · · ]  
  • +3 +/
    А где брейнфак?((
     
     
  • 2.14, Аноним (-), 11:06, 23/02/2011 [^] [^^] [^^^] [ответить]  
  • +3 +/
    там нет комментариев
     

  • 1.5, Frank (ok), 10:34, 23/02/2011 [ответить] [﹢﹢﹢] [ · · · ]  
  • +8 +/
    > fuck it.  let's release

    :)))

     
  • 1.7, Zenitur (?), 10:40, 23/02/2011 [ответить] [﹢﹢﹢] [ · · · ]  
  • –13 +/
    Что? Python не быдлоязык? Не согласен. Надо считать в процентном соотношении кода/проектов, а не по количеству ругательств.
     
     
  • 2.10, Blin (??), 10:48, 23/02/2011 [^] [^^] [^^^] [ответить]  
  • +1 +/
    "Note that I ripped an equal amount of commit messages per language so the results aren't based on how many projects there are per language."

    Полезно читать оригинал статьи.

     
     
  • 3.18, Kodir (?), 11:32, 23/02/2011 [^] [^^] [^^^] [ответить]  
  • –6 +/
    Получается, выборка нерепрезентативна! Фуфло, а не статистика.

    А ещё хорошо бы распределение самих слов в пределах языка. Например, зашкаливающее WTF говорит о низком качестве языка.

     
     
  • 4.41, Daemontux (ok), 14:33, 23/02/2011 [^] [^^] [^^^] [ответить]  
  • +1 +/
    >... зашкаливающее WTF говорит о низком качестве языка.

    или кодера

     

  • 1.8, Pel (?), 10:44, 23/02/2011 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    Интересно, а они подсчитывали количество слов на единицу объёма кода или вообще только то что было доступно на гитхабе. Там может на пхп и питоне совсем мало сорцов. Тогда это исследование будет совсем необъективным...
     
     
  • 2.15, uhbif19 (?), 11:13, 23/02/2011 [^] [^^] [^^^] [ответить]  
  • +1 +/
    http://www.opennet.me/opennews/art.shtml?num=29685#7
     

  • 1.9, sndev (ok), 10:47, 23/02/2011 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    Прикольное исследование, полезное :):)

    Но как прально кто-то заметил "phuck it, let's release it" не совсем относится
    к ругательству по поводу языка.

    Из личного опыта - ругался как сапожник в коментариях, и только лишь потому,
    что заказанный функционал был тотальный космос, понятный только инопланетному
    разуму.

     
  • 1.11, Дмитрий (??), 10:49, 23/02/2011 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    Статью можна было назвать "Оценка уровня культуры программистов для различных языков программирования".
     
     
  • 2.20, Kodir (?), 11:36, 23/02/2011 [^] [^^] [^^^] [ответить]  
  • +5 +/
    > Статью можна было назвать "Оценка уровня культуры программистов для различных языков программирования".

    :) Программирование, как и ношение грузов или ремонт авто, не оставляет шансов нормальному человеку на вежливое общение - чем больше ты углубляешься в ИТ, тем шире набор нехороших слов, которыми ты хотел бы назвать девелоперов. И это правда - 90% прогеров должны честно себе признаться, что они чмошники и должны лучше изучать программинг.

     

  • 1.19, div (??), 11:36, 23/02/2011 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    Хотелось бы услышать мнение мегаэкспертов, рассказывающих про "в английском языке мата нет!"
     
     
  • 2.21, Kodir (?), 11:38, 23/02/2011 [^] [^^] [^^^] [ответить]  
  • –1 +/
    > Хотелось бы услышать мнение мегаэкспертов, рассказывающих про "в английском языке мата
    > нет!"

    Он есть, но американцы - трусы и сутяжники, поэтому им выгоднее лицемерить.

     
     
  • 3.22, div (??), 11:41, 23/02/2011 [^] [^^] [^^^] [ответить]  
  • +/
    это заблуждение... такие же люди. или ты хочешь сказать, что ты на работе со всеми исключительно матом разговариваешь? есть рамки приличия, как у всех, и они их соблюдают.
     
     
  • 4.54, Аноним (-), 16:23, 23/02/2011 [^] [^^] [^^^] [ответить]  
  • +/
    > это заблуждение... такие же люди. или ты хочешь сказать, что ты на
    > работе со всеми исключительно матом разговариваешь? есть рамки приличия, как у
    > всех, и они их соблюдают.

    Наоборот, то что у нас скажут в лицо (совсем не обязательно матом), там промолчат и будут втихую делать по-своему или начальству жаловаться пойдут. Работаю с американским отделением программистов, менталитет действительно очень сильно отличается. "ссыкуны и сутяжники" - очень точно сказано.

     
     
  • 5.62, div (??), 16:51, 23/02/2011 [^] [^^] [^^^] [ответить]  
  • +1 +/
    не могу сказать тоже самое о своих. с точностью до наоборот всё.
     
  • 5.72, Митра (?), 18:26, 23/02/2011 [^] [^^] [^^^] [ответить]  
  • +/
    Возможно, вас обманули и вы работаете с индусами.
     
     
  • 6.82, Kodir (?), 10:48, 24/02/2011 [^] [^^] [^^^] [ответить]  
  • +/
    > Возможно, вас обманули и вы работаете с индусами.

    :)) Как вариант, но мерикосы ещё хуже.

     
  • 4.81, Kodir (?), 10:47, 24/02/2011 [^] [^^] [^^^] [ответить]  
  • +/
    > это заблуждение... такие же люди.

    Чушь. АБСОЛЮТНО другие. Были бы они как мы, у нас бы не было НАСТОЛЬКО разных культур. Те "американцы", которые "как вы", скорее всего и есть выходцы из европ. Коренные (или адаптировавшиеся) америкосы следуют своим понятиям - улыбаться, лицемерить, толерастить бабушку, но ВНУТРИ себя они тоже хотят быть свободными как русские. Им тоже надоело повсеместное враньё, но они сами поддерживают это болото.

     
     
  • 5.85, div (??), 13:42, 24/02/2011 [^] [^^] [^^^] [ответить]  
  • +/
    Все ты переубедил меня Если бы у бабушки был мужской половой орган -- она был... большой текст свёрнут, показать
     
  • 2.27, Аноним (-), 12:21, 23/02/2011 [^] [^^] [^^^] [ответить]  
  • +1 +/
    > Хотелось бы услышать мнение мегаэкспертов, рассказывающих про "в английском языке мата нет!"

    Так Вы сами откройте файл и посмотрите, там всего три слова: кака, попа и совокупление, какой же это мат? :)

     
     
  • 3.84, Онаним (?), 10:59, 24/02/2011 [^] [^^] [^^^] [ответить]  
  • +/
    Таки его там дофига.
    А.Ю. Кудрявцев, Г.Д. Куропаткин Англо-русский словарь-справочник табуизированной лексики и эвфемизмов ("ABC of Dirty English") М., Комт, 1993, 303 с.
    > там всего три слова: кака, попа и совокупление

    Вспомните анекдот про басиста, который "уже нашёл" :)

     

  • 1.25, Аноним (-), 12:16, 23/02/2011 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    А что они за 100% взяли для одного языка? Суммарное количество коммитов на всех языках? Этож не верно... а если процент от всего коммитов _на этом языке_, тогда как они уместили все проценты на одной диаграмме не перекрываясь?
     
     
  • 2.50, filosofem (ok), 16:08, 23/02/2011 [^] [^^] [^^^] [ответить]  
  • +/
    >А что они за 100% взяли для одного языка?

    210
    КО

     

  • 1.32, Below (ok), 13:07, 23/02/2011 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    А где же perl?
     
  • 1.34, тоже Аноним (ok), 13:26, 23/02/2011 [ответить] [﹢﹢﹢] [ · · · ]  
  • +2 +/
    Вряд ли диаграмма, показывающая количество ЛЮБЫХ комментариев в текстах на этих языках, будет сильно отличаться от представленной.
     
  • 1.36, Xaionaro (ok), 13:40, 23/02/2011 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Не думаю, что много PHP разработчиков использует git. Думаю, если брать в процентном соотношении мат/коммит для каждого языка, диаграмма получится совершенно иной.
     
     
  • 2.39, 2Nike (ok), 14:14, 23/02/2011 [^] [^^] [^^^] [ответить]  
  • +/
    > Не думаю, что много PHP разработчиков использует git. Думаю, если брать в
    > процентном соотношении мат/коммит для каждого языка, диаграмма получится совершенно иной.

    Так и сделано.

     
     
  • 3.47, Xaionaro (ok), 15:47, 23/02/2011 [^] [^^] [^^^] [ответить]  
  • +/
    В новости написано, что "лидируют [u]по числу ругательств[/u]", а не по пропорции (коммиты с матом)/(все коммиты).
     

  • 1.42, pavlinux (ok), 14:35, 23/02/2011 [ответить] [﹢﹢﹢] [ · · · ]  
  • +4 +/
    Если в Питоне вставить комментарий, то можно нарушить логику программы. :)
     
     
  • 2.83, Kodir (?), 10:51, 24/02/2011 [^] [^^] [^^^] [ответить]  
  • +/
    > Если в Питоне вставить комментарий, то можно нарушить логику программы. :)

    Вставить куда, извините? :)

     
     
  • 3.86, pavlinux (ok), 15:10, 24/02/2011 [^] [^^] [^^^] [ответить]  
  • +/
    >> Если в Питоне вставить комментарий, то можно нарушить логику программы. :)
    > Вставить куда, извините? :)

    Берешь питона и вставляешь ему.

     

  • 1.64, pavlinux (ok), 17:10, 23/02/2011 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    cd usr src kernel linux-2 6 git pull egrep -R fuck 124 shit 124 as... большой текст свёрнут, показать
     
     
  • 2.65, crypt (??), 17:34, 23/02/2011 [^] [^^] [^^^] [ответить]  
  • +/
    > # cd /usr/src/kernel/linux-2.6
    > # git pull
    > # egrep -R  "fuck| shit | ass " --color ./

    по-моему надо было egrep -Ri ...

    я также попытался поискать в утекших исходниках KIS 2008, но там только слово GPL :(

     
  • 2.69, Аноним (-), 17:49, 23/02/2011 [^] [^^] [^^^] [ответить]  
  • +/
    Вот для фри 8 2-RELEASE FreeBSD 8 2-RELEASE tools regression file dup dup c ... большой текст свёрнут, показать
     
     
  • 3.71, Аноним (-), 17:59, 23/02/2011 [^] [^^] [^^^] [ответить]  
  • +/
    > Вот для фри 8.2-RELEASE:

    Итого восемь случаев использования слова fuck в коде. все остальное - фортунки и контриб.

     
     
  • 4.73, noname (??), 18:52, 23/02/2011 [^] [^^] [^^^] [ответить]  
  • +/
    в 9-ом релизе будет на одно больше?
     
  • 3.80, анонимус (??), 05:16, 24/02/2011 [^] [^^] [^^^] [ответить]  
  • +/
    из чего делаем вывод, что геймо-писатели - матершинники.
     
  • 2.75, Андрей (??), 19:52, 23/02/2011 [^] [^^] [^^^] [ответить]  
  • +/
    да и про чипсеты можно узнать :)
     

  • 1.79, anthonio (ok), 05:07, 24/02/2011 [ответить] [﹢﹢﹢] [ · · · ]  
  • +2 +/
    Скорее это показывает популярность языка на github. Ну и да, питонисты и PHP-исты не пользуются github. У первых есть mercurial и bitbucket, а вторые тупо не умеют :D
     

     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2024 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру