URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID3
Нить номер: 102491
[ Назад ]

Исходное сообщение
"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."

Отправлено opennews , 10-Май-15 14:52 
Представлен новый выпуск rmlint 2.2.0 (https://github.com/sahib/rmlint), утилиты для чистки файловой системы, выявляющей дубликаты файлов и директорий, исполняемые файлы с отладочной информацией, повреждённые символические ссылки, пустые файлы, файлы с некорректными идентификаторами владельца и группы. Кроме штатного режима сравнения по контрольным суммам, доступен режим побайтового сопоставления. Программа отличается высокой производительностью, поддержкой различных форматов вывода (отчёт в JSON, shell-сценарий чистки), возможностью проверки только новых файлов. Код написан на языке Си и распространяется под лицензией GPLv3.

URL: http://www.reddit.com/r/linux/comments/35g1hy/rmlint_220_rel.../
Новость: http://www.opennet.me/opennews/art.shtml?num=42200


Содержание

Сообщения в этом обсуждении
"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено Аноним , 10-Май-15 14:52 
> Код написан на языке Си и распространяется под лицензией GPLv3.

Годнота.


"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено Аноним , 11-Май-15 15:53 
> Годнота.

А как оно относится с JSON и shell-скриптами к всяким креативно оформленным путям?

Ну там например в /home/username создать субдиру " subdir" (с пробелом в начале). Что там у нас скрипт потрет? :)


"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено KOT040188 , 10-Май-15 15:03 
Вот только недавно искал нечто подобное.

"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено Michael Shigorin , 11-Май-15 22:36 
> Вот только недавно искал нечто подобное.

Их довольно много, сходу вспомнилось findd.


"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено Аноним , 10-Май-15 15:17 
Уф... на С, слава Богу, а то я уж подумал, что очередной бинарь на 20Мб

"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено ячс , 11-Май-15 00:52 
> Уф... на С, слава Богу, а то я уж подумал, что очередной бинарь на 20Мб

Угу, на ц оно само работает ведь

-I/usr/include/at-spi2-atk/2.0
18    -I/usr/include/gtk-3.0
19    -I/usr/include/gio-unix-2.0/
20    -I/usr/include/cairo
21    -I/usr/include/pango-1.0
22    -I/usr/include/atk-1.0
23    -I/usr/include/cairo
24    -I/usr/include/pixman-1
25    -I/usr/include/freetype2
26    -I/usr/include/libpng16
27    -I/usr/include/harfbuzz
28    -I/usr/include/freetype2
29    -I/usr/include/harfbuzz
30    -I/usr/include/libdrm
31    -I/usr/include/libpng16
32    -I/usr/include/gdk-pixbuf-2.0
33    -I/usr/include/libpng16
34    -I/usr/include/glib-2.0


"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено Crazy Alex , 11-Май-15 02:52 
Понятие "shared libraries" знакомо, надеюсь?

"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено Аноним , 11-Май-15 12:58 
Эти либы написаны на си и их использует всё, включая go и python. Проблема низкой производительности и большого потребления памяти приложений на том же python не в них.

"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено Аноним , 11-Май-15 15:44 
И где ты в зависимостях этой программы нашел эти либы, интересно?

"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено Аноним , 10-Май-15 15:42 
А реестр она не чистит?

"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено cmp , 10-Май-15 16:14 
Ага мне вот тоже интересно как можно пользоваться линуксом и при этом не научится элементарным правилам, чтобы засрать фс, чтобы этим пользоваться

"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено YetAnotherOnanym , 10-Май-15 16:45 
Разные ситуации бывают, не спешите осуждать.

"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено Омномним , 11-Май-15 11:00 
Нет, поддержка systemd пока не реализована.

"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено Аноним , 10-Май-15 15:52 
код на си но для убунта питон3 необходим

"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено grayich , 10-Май-15 15:58 
кто пользовал, как она относительно fdupes ?

"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено ононимус , 11-Май-15 16:27 
rmlint намного быстрее. fdupes сравнивает по контрольным суммам, но побайтовый режим часто быстрее. Например, если нужно сравнить два файла по 4Gb и они отличаются в первом байте, то побайтовое сравнение считает с диска только первый блок из каждого файла, а сравнение по контрольным суммам прочитает оба файла полностью. А из-за кеширования в Linux как правило файлы много раз считывать заново не придется, поэтому преимущество от контрольных сумм теряется. Но быстрее всех rdfind, там еще хитрые оптимизации с сортировкой файлов по inode.

"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено grayich , 11-Май-15 16:45 
возможно ошибаюсь, но вроде где-то читал,
что fdupes сначала по размерам сравнивает, потом(если размеры совпали) по crc, а потом по md5 или sha

"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено Xasd , 10-Май-15 17:41 
нужно ещё чтобы эта программа находила бы и исправляла бы системные ошибки в операционной системе!


;)


"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено anonimko , 10-Май-15 19:33 
единичные герои, неподдающиеся python истерии, когда-нибудь спасут мир

"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено pp , 10-Май-15 20:36 
причем тут истерия, когда быстро надо что то наклепать питон самое то. например в саблиме плагины пишутся на питоне, и я за 15 минут написал плагин который создает файл для gdb с вписанным именем файлом и строкой для бряков (по строкам которые я отметил в саблиме), которые автоматом потом загружается при дебаге. просто разные задачи у языков

"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено Аноним , 10-Май-15 21:56 
Никто и не спорит, если питон применяется по назначению, например быстро написать себе скрипт, это даже хорошо. Но писать ПО на питоне для массового пользователя, как делается в убунте - это зло. И немногие это осознают.

"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено ячс , 11-Май-15 00:50 
> Никто и не спорит, если питон применяется по назначению, например быстро написать себе скрипт, это даже хорошо. Но писать ПО на питоне для  массового пользователя

Быстро написать для себя - хорошо, но быстро написать для других - это зло. Логично.


"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено Аноним , 11-Май-15 01:01 
Логично. Когда время создания делится на множество пользователей, может появится смысл затратить больше времени, чтобы сделать более качественно.

"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено Аноним , 11-Май-15 10:54 
Быстро написать для себя - хорошо, но быстро написать тормозящее приложение, жрущее оперативку и требующее более 200 мегабайт зависимостей, которым будут пользоваться миллионы пользователей потом и очень долго - это больше чем зло.

"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено Аноним , 11-Май-15 16:03 
> Быстро написать для себя - хорошо, но быстро написать для других -
> это зло. Логично.

Поэтому я для себя написал прожку, которая жует... в первом приближении то что выдает fdupes. Но после моего просмотра. И фигачит unlink() на это. Быстро и сердито, на си. Потому что совсем не прикольно пытаться накормить шелскрипты теми путями которые у меня на дисках встречаются (с неправильными кодировками и прочая). Шелл таким макаром в два счета вынесет полдиска с его разбором wildcard и прочая :)

Hint: в именах файлов может быть "*", "?", " ", и другие веселые символы. Что очень доставляет при попытке автоматизировать обработку.


"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено Xasd , 11-Май-15 18:45 
> Hint: в именах файлов может быть "*", "?", " ", и другие веселые символы. Что очень доставляет при попытке автоматизировать обработку.

hint: такая проблема есть только у bash (и ну ни как не у Python) .. и именно поэтому не рекомендуется писать код на bash размером более чем три короткие строчки :-)


"(offtopic) кто, если не Це"
Отправлено Michael Shigorin , 11-Май-15 22:43 
> .. и именно поэтому не рекомендуется писать код на
> bash размером более чем три короткие строчки :-)

Это если четыре штанины.  А так-то http://docs.altlinux.org/archive/2.2/master/devel-html/ch03....


"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено Аноним , 12-Май-15 09:09 
Луче перефразировать более корректно: Быстро написать для себя - хорошо, но быстро написать тормозное, тяжелое и непортируемое по для других - это зло.

"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено gvr , 10-Май-15 23:26 
Питон старше тебя, лол.

"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено Аноним , 11-Май-15 01:03 
Как будто возраст — это что-то хорошее. Особенно для ЯП.


"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено _KUL , 12-Май-15 01:45 
А как же явный пример между С++ и --E ??? Через десяток лет и --Е станет крутым. Возраст - важный аспект для оттестирования всего вся в языке.

"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено Аноним , 12-Май-15 09:08 
В случае питона с возрастом растет его размер, тормознутость и жручесть оперативки. И работа по улучшению в этих направлениях не ведется, поскольку они не являются задачами данного языка.

"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено Аноним , 11-Май-15 10:55 
Всмысле питон - старперский язык?

"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено Аноним , 11-Май-15 15:56 
> единичные герои, неподдающиеся python истерии, когда-нибудь спасут мир

Нынче у хипстоты мода на go. Вон в соседней новости - "pwd с некоторыми ограничениями" :)


"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено Аноним , 10-Май-15 19:46 
Нашла в хомяке гиг хлама

"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено Куяврег , 10-Май-15 20:16 
звучит как "одел очки, оказывается пока ел обляпался"

"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено Аноним , 11-Май-15 15:57 
> Нашла в хомяке гиг хлама

Запустил fdupes. Убил 100Гб дряни. Учись, студент! :P


"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено Анончик , 10-Май-15 20:02 
Непорядок. Должно быть написано на Go.

"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено Anonim , 10-Май-15 23:43 
>Непорядок. Должно быть написано на Go.

Нет. На Javascript


"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено Анончег , 11-Май-15 05:39 
> Нет. На Javascript

При чём в браузере, иначе не труЪ!


"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено Аноним , 11-Май-15 06:01 
одобряю, щас к себе в архив, и даже буду пользоватся.

"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено vn971 , 11-Май-15 12:15 
По этой теме ещё похожую утилиту упомяну: `hardlink`.
Ищет дубликаты файлов и позволяет их между собой захардлинкать, полезно для бэкапов и неизменяемых файлов типа видео/аудио.

"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено Аноним , 11-Май-15 15:59 
> Ищет дубликаты файлов и позволяет их между собой захардлинкать, полезно для бэкапов

Особенно когда под файлом вылезет бэд. Тогда вы наконец поймете шутку про нортон командер, два диска цэ и "а зачем мне их два?!"



"Выпуск rmlint 2.2.0, инструмента для выявления дубликатов фа..."
Отправлено Michael Shigorin , 11-Май-15 22:44 
>> Ищет дубликаты файлов и позволяет их между собой захардлинкать, полезно для бэкапов
> Особенно когда под файлом вылезет бэд.

Хламовник бэкапнику не замена.