<?xml version="1.0" encoding="koi8-r"?>
<rss version="0.91">
<channel>
    <title>OpenForum RSS: Анализ степени дублирования кода на GitHub</title>
    <link>https://opennet.dev/openforum/vsluhforumID3/112797.html</link>
    <description>Представлены (https://blog.acolyer.org/2017/11/20/dejavu-a-map-of-code-duplicates-on-github/) результаты (https://dl.acm.org/ft_gateway.cfm?id=3133908&amp;ftid=1914259&amp;dwn=1&amp;CFID=1007984917&amp;CFTOKEN=65060051) изучения дублирования кода в общем объёме исходных текстов, размещённых на GitHub. Проанализировано (http://mondego.ics.uci.edu/projects/dejavu/) 4.5 млн различных проектов (без форков репозиториев), включающих более 428 млн файлов с кодом на языках  Java, C++, Python и JavaScript. Из этих файлов лишь 85 млн оказались уникальными, т.е. 80&#037; кода на GitHub являются копиями других файлов.&lt;br&gt;&lt;br&gt;&lt;br&gt;Определение дубликатов выполнялось несколькими методами: путём сравнения хэшей файлов (полные копии), хэшей сгруппированного набора токенов из файла (не учитывает форматирование и комментарии) и оценки частичного заимствования кода при помощи SourcererCC (https://github.com/Mondego/SourcererCC) (определён отредактированный код с 80&#037; общих токенов).&lt;br&gt;&lt;br&gt;&lt;br&gt;Наиболее часто дубликаты встречаются в коде на языке JavaScript, для кот</description>

<item>
    <title>Анализ степени дублирования кода на GitHub (Аноним)</title>
    <link>https://opennet.dev/openforum/vsluhforumID3/112797.html#56</link>
    <pubDate>Tue, 28 Nov 2017 07:37:26 GMT</pubDate>
    <description>Сейчас никто не умеет версии назначать. Херачат тупо в мастере. То ли индусы, то ли смузихлёбы. Иди разбери их. Это, конечно, не отменяет того, что можно зависимости объявлять в номерах коммитов. Но всё таки факт отсутствия культуры разработки и именования версий это не отменяет&lt;br&gt;</description>
</item>

<item>
    <title>Анализ степени дублирования кода на GitHub (pripolz)</title>
    <link>https://opennet.dev/openforum/vsluhforumID3/112797.html#55</link>
    <pubDate>Mon, 27 Nov 2017 09:38:27 GMT</pubDate>
    <description>а где m4?&lt;br&gt;</description>
</item>

<item>
    <title>Анализ степени дублирования кода на GitHub (pripolz)</title>
    <link>https://opennet.dev/openforum/vsluhforumID3/112797.html#54</link>
    <pubDate>Mon, 27 Nov 2017 09:25:09 GMT</pubDate>
    <description>configure.ac и autogen.sh )))&lt;br&gt;</description>
</item>

<item>
    <title>Анализ степени дублирования кода на GitHub (Ilya Indigo)</title>
    <link>https://opennet.dev/openforum/vsluhforumID3/112797.html#52</link>
    <pubDate>Thu, 23 Nov 2017 22:16:42 GMT</pubDate>
    <description>сказочный&lt;br&gt;</description>
</item>

<item>
    <title>Анализ степени дублирования кода на GitHub (lolwat)</title>
    <link>https://opennet.dev/openforum/vsluhforumID3/112797.html#49</link>
    <pubDate>Tue, 21 Nov 2017 23:12:30 GMT</pubDate>
    <description>думать сложно - пойду писать проекты на JavaScript&lt;br&gt;</description>
</item>

<item>
    <title>Анализ степени дублирования кода на GitHub (lolwat)</title>
    <link>https://opennet.dev/openforum/vsluhforumID3/112797.html#48</link>
    <pubDate>Tue, 21 Nov 2017 23:04:44 GMT</pubDate>
    <description>долбаёб&lt;br&gt;</description>
</item>

<item>
    <title>Анализ степени дублирования кода на GitHub (m_and_ms)</title>
    <link>https://opennet.dev/openforum/vsluhforumID3/112797.html#47</link>
    <pubDate>Tue, 21 Nov 2017 19:45:45 GMT</pubDate>
    <description>__init__.py часто не пустой&lt;br&gt;</description>
</item>

<item>
    <title>Анализ степени дублирования кода на GitHub (пох)</title>
    <link>https://opennet.dev/openforum/vsluhforumID3/112797.html#46</link>
    <pubDate>Tue, 21 Nov 2017 17:43:51 GMT</pubDate>
    <description>&amp;gt; Фишка в том, что распределённая система превращается в систему с одним-единственным сервером&lt;br&gt;&lt;br&gt;как и весь этот ваш интернет-2.0(или уже 3.0?)&lt;br&gt;&lt;br&gt;&amp;gt; И вопрос в том, что будет, если этот сервер перестанет быть доступен или вообще существовать -&lt;br&gt;&amp;gt; сколько кода будет вне этого зеркала?&lt;br&gt;&lt;br&gt;весь будет, на локальной машине того самого единственного автора единственной версии 1.&lt;br&gt;&lt;br&gt;но вот найти его тебе будет очень и очень трудно, потому что ты об этом авторе ничего не знаешь, и общался с ним ты тоже через гитхаб.&lt;br&gt;&lt;br&gt;большие проекты, у которых в силу исторических причин, старости разработчиков или принадлежности компаниям, есть другие средства коммуникации - хорошо известный сайт, smtp-рассылка, вебфорум - выкарабкаются, а остальные найдут друг друга может через несколько лет, когда уже никому никто будет не нужен.&lt;br&gt;&lt;br&gt;</description>
</item>

<item>
    <title>Анализ степени дублирования кода на GitHub (Аноним)</title>
    <link>https://opennet.dev/openforum/vsluhforumID3/112797.html#45</link>
    <pubDate>Tue, 21 Nov 2017 13:42:30 GMT</pubDate>
    <description>Решается элементарно. Собрать проект, убедиться, что всё работает, и специальной утилитой зафиксировать версии для _всего_ дерева зависимостей. Так, например, позволяет делать zc.buildout в Питоне, если сказать ему pick-versions.&lt;br&gt;</description>
</item>

</channel>
</rss>
