Home Искусственный интеллект Лучшие ресурсы для начала работы с компьютерным зрением и глубоким обучением | DeepTech

Лучшие ресурсы для начала работы с компьютерным зрением и глубоким обучением | DeepTech

0
Лучшие ресурсы для начала работы с компьютерным зрением и глубоким обучением
 | DeepTech

Здесь вы найдете лучшие онлайн-курсы, книги и блоги, чтобы узнать, как применять Deep Learning в приложениях Computer Vision.

Джастин Джонсон проделывает феноменальную работу, описывая все аспекты глубокого обучения с точки зрения компьютерного зрения. Вы узнаете все, что вам нужно знать, от фундаментальных понятий, таких как обратное распространение и сверточные нейронные сети, до обнаружения объектов и сегментации изображений. Обязательно для начинающих

Инструкторы: Джастин Джонсон

Темы, которые привлекли наше внимание:

  • 3D видение

  • Обучение с подкреплением

  • Генеративные модели

Этот курс, являющийся частью специализации Deep Learning от Coursera, предназначен для того, чтобы научить вас всему о сверточных нейронных сетях и о том, как они применяются в изображениях и видео. Вы начнете с «Основ сверточных нейронных сетей», затем увидите несколько тематических исследований и продолжите с «Обнаружение объектов». Наконец, вы погрузитесь в распознавание лиц и передачу нейронного стиля (NST).

NST — это метод оптимизации, используемый для получения двух изображений — изображения содержимого и эталонного изображения стиля (например, произведения искусства известного художника) — и смешивания их вместе, чтобы выходное изображение выглядело как изображение содержимого, но «нарисовано» в стиль эталонного изображения стиля.


передача нейронного стиля


Источник:xpertup

Инструкторы: Эндрю Нг, Юнес Бенсуда Мурри

Здесь мы включили два курса в один раздел, потому что один является продолжением другого. В частности, если вас интересует только компьютерное зрение, сосредоточьтесь на следующих подкурсах:

Как вы уже догадались, вы узнаете, как решать реальные приложения компьютерного зрения с помощью Tensorflow. Так что будьте готовы к тщательному разбору фреймворка и его тонкостей.

Инструкторы: Лоуренс Морони, Эдди Шью

Раскрытие информации: обратите внимание, что некоторые из ссылок в этом посте могут быть партнерскими ссылками, и без каких-либо дополнительных затрат для вас мы будем получать комиссию, если вы решите совершить покупку после перехода по ссылке.

Этот курс в основном посвящен основам компьютерного зрения и не уделяет много времени глубоким нейронным сетям. Тем не менее, мы считаем, что всегда следует изучать основной принцип, прежде чем переходить к более продвинутым концепциям. Так что, если вы согласны с нами, вам обязательно стоит пройти этот курс.

Примеры тем:

  • Модели камер и вид

  • Осветительные приборы

  • Отслеживание

  • Движение изображения

Инструкторы: Аарон Бобик, Ирфан Эсса, Арпан Чакраборти

CS231 — один из самых известных курсов по компьютерному зрению и, вероятно, один из самых полных. Общедоступные видеолекции на Youtube относятся к 2017 году, поэтому иногда они могут показаться немного устаревшими, но это не значит, что они не очень хорошо написаны и продуманы. Большим плюсом являются невероятные заметки, которые можно найти на сайт курса.

Примеры лекций:

  • Архитектуры CNN

  • Обнаружение и сегментация

  • Глубокое обучение с подкреплением

  • Состязательные примеры и состязательная подготовка

Инструкторы: Фей-Фей Ли, Джастин Джонсон, Серена Юнг

Основная программа компьютерного зрения Udacity — это практический курс, сочетающий теоретические концепции с практическими руководствами и реальными проектами. Требуется средний уровень знаний в Python, статистике и машинном обучении. Это, по общему признанию, высокая стоимость, но она компенсируется технической поддержкой наставника, большим студенческим сообществом и персонализированными карьерными услугами.

Проекты:

  • Обнаружение ключевых точек лица

  • Автоматическое добавление подписей к изображениям

  • Обнаружение и отслеживание ориентиров

Инструкторы: Себастьян Трун, Джей Аламмар, Луис Серрано

Этот курс Udemy имеет двойную направленность: он исследует основные принципы компьютерного зрения, а также передовые методы глубокого обучения. Вы будете использовать NumPy, OpenCV, Tensorflow/Keras для решения множества практических задач.

Примеры уроков:

Инструкторы: Хосе Портилья

Еще один курс от Udemy, посвященный архитектуре глубокого обучения. Вы узнаете о сверточных нейронных сетях, одиночных коротких детекторах и генеративно-состязательных сетях.

Примеры уроков:

  • Распознавание лиц с помощью OpenCV

  • Обнаружение объектов с помощью SSD

  • Генерация изображения с Генеративно-состязательные сети (ГАН). GAN относятся к двум нейронным сетям, которые играют в минимальную игру на протяжении всего обучения (градиентный подъем-спуск), а именно к генератору G и дискриминатору D. Вход G представляет собой случайный шум, который выбирается из распределения в небольшом диапазоне действительных чисел. Для генерации изображения выход G будет сгенерированным изображением. Основное отличие состоит в том, что теперь мы фокусируемся на создании репрезентативных примеров определенного распределения (т. е. собак, картин, уличных изображений, самолетов и т. д.). Дискриминатор — не что иное, как бинарный классификатор, фокусирующийся на изучении распределения класса.


Ган-пример


Изображение автора

Инструкторы: Кирилл Еременко, Хаделин де Понтев, Лигентская команда

Книга на 480 страниц, которая охватывает все, что вам нужно знать о современных системах компьютерного зрения. Он разделен на 3 разные части: основа глубокого обучения, классификация и обнаружение изображений, генеративные модели и визуальные встраивания. Отличный выбор для программистов на Python среднего уровня и новичков в области глубокого обучения.

Главы, которые нас заинтересовали:

  • Расширенные архитектуры CNN: LeNet, AlexNet, VGGNet, Inception

  • Вы смотрите только один раз (YOLO). ЙОЛО семейство архитектур представляет собой серию моделей глубокого обучения, предназначенных для быстрого обнаружения объектов, разработанных Джозеф Редмони другие.

  • Deepdream и Neural Style Transfer. DeepDream — это экспериментальная идея, направленная на визуализацию паттернов нейронных сетей. Эти шаблоны усваиваются нейронной сетью во время обучения. На практике DeepDream улучшает паттерны, которые он видит в изображении.

  • Визуальные вложения


пример глубокого сна


Пример изображения из глубокого сна. Источник: Учебники по тензорному потоку

Автор: Мохамед Эльгенди


системы глубокого обучения для систем машинного зрения

Блоги о компьютерном зрении

Другие курсы по компьютерному зрению

Следующий список основан на потрясающем Страница на гитхабе @jbhuang0604:

Книга «Глубокое обучение в производстве» 📖

Узнайте, как создавать, обучать, развертывать, масштабировать и поддерживать модели глубокого обучения. Изучите инфраструктуру машинного обучения и MLOps на практических примерах.

Узнать больше

* Раскрытие информации: обратите внимание, что некоторые из приведенных выше ссылок могут быть партнерскими ссылками, и мы без дополнительных затрат для вас получим комиссию, если вы решите совершить покупку после перехода по ссылке.

LEAVE A REPLY

Please enter your comment!
Please enter your name here