The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

Выпуск библиотеки компьютерного зрения OpenCV 4.0

20.11.2018 17:10

Представлен релиз свободной библиотеки OpenCV 4.0 (Open Source Computer Vision Library), предоставляющей средства для обработки и анализа содержимого изображений. OpenCV предоставляет более 2500 алгоритмов, как классических, так и отражающих последние достижения в области компьютерного зрения и систем машинного обучения. Код библиотеки написан на языке С++ и распространяется под лицензией BSD. Биндинги подготовлены для различных языков программирования, включая Python, MATLAB и Java.

Библиотека может применяться для распознавания объектов на фотографиях и видео (например, распознавание лиц и фигур людей, текста и т.п.), отслеживания движения объектов и камеры, классификации действий на видео, преобразования изображений, извлечения 3D-моделей, формирования 3D-пространства из изображения от стереокамер, создания высококачественных изображений через объединение изображений более низкого качества, поиска на изображении объектов, похожих на представленный набор элементов, применения методов машинного обучения, расстановки маркеров, выявления общих элементов на разных изображениях, автоматического устранения дефектов, таких как эффект красных глаз.

В новом выпуске:

  • Осуществлён переход на C++11 в качестве основного языка для разработки библиотеки. Соответственно, для сборки теперь требуется наличие компилятора, поддерживающего стандарт C++11. Повышены требования к сборочному инструментарию, для сборки теперь необходимо наличие CMake 3.5.1 или более нового выпуска;
  • Проведена чистка C API, удалены многие устаревшие вызовы OpenCV 1.x ;
  • В модуле core с языка Си на Си++ полностью переписан код для хранения и чтения структурированных данных в форматах XML, YAML и JSON. Новая реализация потребляет в 3-6 раз меньше памяти;
  • Представлен новый модуль G-API (opencv_gapi), выполняющий функции движка для эффективной обработки изображений с использованием алгоритмов на основе графов;
  • В модуль DNN (Deep Neural Network) с реализацией алгоритмов машинного обучения на основе нейронных сетей добавлен экспериментальный бэкенд для использования графического API Vulkan на платформах без поддержки OpenCL. Добавлена поддержка формата ONNX (Open Neural Network Exchange) для представления моделей машинного обучения. Добавлена поддержка модели Mask-RCNN для классификации и распознавание изображений. Проведена оптимизация производительности модуля DNN. Улучшено использование OpenCL-ускорения на GPU AMD и NVIDIA;
  • Реализован алгоритм Kinect Fusion для построения 3D-моделей реальных объектов на основе данных от видеокамеры с датчиком глубины. Реализация оптимизирована для CPU и GPU (OpenCL). В состав также добавлен модуль opencv_contrib/rgbd с поддержкой RGB-D (Red-Green-Blue-Depth) камер, таких как используются в приставке Kinect;
  • В модуль objdetect добавлены детектор и декодировщик QR-кодов;
  • Несколько сотен базовых ядер OpenCV переписаны с использованием универсальных функций, которые сопоставлены с аналогичными функциями расширений SSE2, SSE4, AVX2, NEON и VSX, выбираемых в зависимости от целевой платформы и флагов компиляции. Изменение положительно сказалось на производительности, например, при сборке OpenCV с флагом CPU_BASELINE=AVX2 наблюдается ускорение выполнения некоторых операций обработки изображений на 15-30%;
  • Эффективный и высококачественный алгоритм отслеживания движения объектов DIS (Dense Inverse Search) перемещён из модуля opencv_contrib в модуль video. Более медленный алгоритм оптического потока TV L1 перемещён в opencv_contrib.


  1. Главная ссылка к новости (https://opencv.org/opencv-4-0-...)
  2. OpenNews: Релиз библиотеки компьютерного зрения OpenCV 3.2
  3. OpenNews: В рамках проекта uWho развивается программа для распознавания лиц на видео
  4. OpenNews: В рамках проекта subpixel подготовлена нейронная сеть для восстановления изображений
  5. OpenNews: Facebook открыл код платформы Detectron для распознавания объектов на фотографиях
  6. OpenNews: Доступен Luminoth, тулкит для решения задач компьютерного зрения
Лицензия: CC BY 3.0
Короткая ссылка: https://opennet.ru/49638-opencv
Ключевые слова: opencv
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (21) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.2, Аноним (2), 17:57, 20/11/2018 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    >>В основных модулях с языка Си на Си++ полностью переписан код для хранения и >>чтения структурированных данных в форматах XML, YAML и JSON

    Зачем в OpenCV свой код для "чтения структурированных данных в форматах XML, YAML и JSON"? Зачем свой очередной велосипед?

     
     
  • 2.4, Аноним (4), 18:18, 20/11/2018 [^] [^^] [^^^] [ответить]  
  • –2 +/
    Для Persistence https://docs.opencv.org/4.0.0/d4/da4/group__core__xml.html
     
  • 2.6, nonimus (?), 18:25, 20/11/2018 [^] [^^] [^^^] [ответить]  
  • –5 +/
    Если бы только это. Зачем библиотеке свой захват с камеры? Тот случай, когда библиотека стремится занять все и стать осью.
     
     
  • 3.7, anonymous (??), 19:03, 20/11/2018 [^] [^^] [^^^] [ответить]  
  • +3 +/
    Тебя никто не заставляет использовать встроенный захват, хочешь - используй свой и обрабатывай. Однако наличие встроенного захвата позволяет очень легко и удобно писать proof-of-concept программы не заморачиваясь с захватом.
     
     
  • 4.28, Аноним (28), 19:32, 28/11/2018 [^] [^^] [^^^] [ответить]  
  • +/
    вот вот, на моем девайсе андройд камера захватывала 3-4 кадра, я написал свою камеру и вот уже 14-15кадров в сек. Для пруфа 3-4 хватает, это да
     
  • 3.14, Nuzhny (?), 23:00, 20/11/2018 [^] [^^] [^^^] [ответить]  
  • +2 +/
    Там нет своего захвата, а лишь обёртка над многими другими: ffmpeg, gstreamer, vfl...
    Скажем, под Windows она также пытается открыть видео последовательно чкерез ffmpeg, dshow, vfw... В зависимости от того, как сконфигурировали cmake'ом. Что первое откроет, через это видео и захватывается. Так что надо сначала разобраться.
     

  • 1.8, Аноним (8), 19:17, 20/11/2018 [ответить] [﹢﹢﹢] [ · · · ]  
  • –1 +/
    Я так и не смог допинать ее для интелектуального детектора движения.
     
     
  • 2.9, Аноним (9), 20:06, 20/11/2018 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Плохо старался
     
     
  • 3.11, Евгений (??), 20:29, 20/11/2018 [^] [^^] [^^^] [ответить]  
  • +/
    Кстати,
    в какую сторону пинать?
     
     
  • 4.21, Аноним (21), 12:59, 21/11/2018 [^] [^^] [^^^] [ответить]  
  • +1 +/
    В сторону мусорного ведра. Ты же не хочешь, чтобы оно от тебя сбежало, правда?
     
  • 2.10, Qwerty (??), 20:16, 20/11/2018 [^] [^^] [^^^] [ответить]  
  • +3 +/
    >Я так и не смог допинать ее для интелектуального детектора движения.

    Виноваты, конечно, разрабы OpenCV?

     
  • 2.16, Nuzhny (?), 23:08, 20/11/2018 [^] [^^] [^^^] [ответить]  
  • +6 +/
    Что это такое?
    Простой детектор движения - это определение значимых изменений в кадре, типа вычитания фона. Посложнее - уже отслеживание перемещения отдельных объектов - multitarget objects tracking. Ещё интеллектуальнее - распознавание объектов (можно тупо прикрутить YOLO или MobileNet). Ещё сложнее - анализ траекторий движения, типа подозрительное движение на парковке, человек бродит туда-сюда.
    Детектор оставленных предметов, особенно на вокзалах - ещё интеллектуальнее. Ещё сложнее? Тогда мультикамерный детектор движения, где надо не терять одного человека, когда он переходит из области видимости одной камеры в другую, понимать, что это именно он. Кто-то прикручивает распознавание лиц (если камеры расположены соответствующим образом) и стараются отслеживать сотрудников внутри здания и определять сколько времени и на что они тратят.
    На каком этапе интеллектуальности ты остановился? И да, в OpenCV готового решения нет. Эта библиотека - не набор готовых решений, а отличный конструктор из примитивов всё более высокого уровня.
     
  • 2.23, none_first (ok), 14:18, 21/11/2018 [^] [^^] [^^^] [ответить]  
  • +/
    > Я так и не смог допинать ее для интелектуального детектора движения.

    "а вот сотрудник Анатолий был послан на ...,
    но сумел
    Вернуться бодрым, отдохнувшим
    И всем магники привез"
    стрельба по белкам https://ufile.io/ma9l0
    движение https://habr.com/company/avi/blog/200804/
    https://habr.com/post/320450/

     

  • 1.13, Аноним (13), 22:18, 20/11/2018 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    >Реализован алгоритм Kinect Fusion (https://www.microsoft.com
    >microsoft.com

    майкрософт реально любит опенсорс, похоже.

     
  • 1.18, Аноним (18), 05:08, 21/11/2018 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    ЕЕ уже разрешили экспортировать из США ? или очередной удар по нац. безопасности ?
     
     
  • 2.20, Аноним (20), 10:14, 21/11/2018 [^] [^^] [^^^] [ответить]  
  • +/
    её в Нижнем Новгороде пилят
     
     
  • 3.25, Аноним (25), 11:20, 22/11/2018 [^] [^^] [^^^] [ответить]  
  • +/
    товарищей из белого дома США волнует это слабо.
    Хостится он где? на github - значит как миленький выполнит постановление самого гуманного суда ;-)
     
  • 2.22, Аноним (21), 13:01, 21/11/2018 [^] [^^] [^^^] [ответить]  
  • +1 +/
    А тебе обязательно разрешение белого господина нужно?
     
     
  • 3.24, Аноним (25), 11:18, 22/11/2018 [^] [^^] [^^^] [ответить]  
  • +/
    Да вот, недавно в США отнесли эти технологии к национально значимым.
    Поэтому те кто без разрешения будут пользоваться - попадут под санкции, а потом при въезде в штаты будут арестованы как нарушители закона.
     
  • 3.26, Аноним (26), 11:43, 22/11/2018 [^] [^^] [^^^] [ответить]  
  • +/
    Он неверно задал вопрос, он хотел спросить, а product_x уже разрешили использовать в России, или всё ещё нужно получать разрешения ;)
    p.s. Это так в качестве шутки...
     
     
  • 4.27, Аноним (25), 12:17, 22/11/2018 [^] [^^] [^^^] [ответить]  
  • +/
    Опубликованный BIS список технологий, контроль за экспортом которых может быть ужесточен, включает в себя, в частности, биотехнологии (в том числе методы генной инженерии), технологии искусственного интеллекта и машинного обучения (в том числе обучения языкам, распознавания и воспроизведения речи и образов), технологии позиционирования и навигации, квантовых вычислений (в том числе шифрования и дешифровки), роботехнологий (в том числе микродроны, самособирающиеся роботы, «умная пыль», групповая робототехника), технологии нейрокомпьютерного интерфейса и гиперзвуковых аппаратов (в том числе алгоритмы контроля движения и термальной защиты), технологии адаптивного камуфляжа и идентификации по лицам и голосу.

    Подробнее на РБК:
    https://www.rbc.ru/politics/20/11/2018/5bf3d9899a794724804366eb

     

     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2024 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру