- 10 октября 2021 г.
- Василис Вриниотис
- . Без комментариев
Последние пару недель в «PyTorch Land» было очень много работы, поскольку мы лихорадочно готовим выпуск PyTorch v1.10 и TorchVision v0.11. Во второй части серии я расскажу о некоторых новых функциях, которые в настоящее время включены в релизную ветку TorchVision.
Отказ от ответственности: Несмотря на то, что предстоящий выпуск содержит множество усовершенствований и улучшений в области ошибок/тестирования/документации, здесь я выделяю новые «ориентированные на пользователя» функции в доменах, которые меня лично интересуют. После написания сообщения в блоге я также заметил предвзятость в отношении функций, которые я просматривал, писал или внимательно следил за их разработкой. Покрытие (или непокрытие) признака ничего не говорит о его важности. Высказанные мнения являются исключительно моими собственными.
Новые модели
Новый выпуск упакован с новыми моделями:
- Кай Чжан добавил реализацию Регнет-архитектура вместе с предварительно обученными весами для 14 вариантов которые точно воспроизводят оригинальную бумагу.
- Недавно я добавил реализацию Эффективная сетевая архитектура наряду с предварительно обученными весами для вариантов B0-B7, предоставленными Люком Мелас-Кириази и Россом Вайтманом.
Новые дополнения к данным
В последнюю версию добавлено несколько новых методов увеличения данных:
- Самуэль Гэбриэл внес свой вклад TrivialAugmentновая простая, но очень эффективная стратегия, которая, по-видимому, обеспечивает превосходные результаты по сравнению с AutoAugment.
- я добавил RandAugment метод автоаугментаций.
- Я предоставил реализацию Mixup и CutMix превращается в ссылки. Они будут перемещены в преобразованиях в следующем выпуске, как только их API будет завершен.
Новые операторы и слои
Включен ряд новых операторов и слоев:
Справочники / Тренировочные рецепты
Несмотря на то, что мы постоянно работаем над улучшением наших эталонных сценариев, вот несколько новых функций, включенных в следующую версию:
- Prabhat Roy добавил поддержку Экспоненциальная скользящая средняя в нашей классификации рецепт.
- Я обновил наши ссылки для поддержки Сглаживание метоккоторый недавно был представлен Джоэлем Шлоссером и Томасом Дж. Фэном на ядре PyTorch.
- Я включил возможность выполнения Разминка скорости обученияиспользуя новейшие планировщики LR, разработанные Ильгаром Рамазанлы.
Другие улучшения
Вот некоторые другие заметные улучшения, добавленные в выпуске:
- Александр Соаре и Франсиско Масса разработали Утилита на основе FX что позволяет извлекать произвольные промежуточные признаки из архитектур модели.
- Никита Шульга добавил поддержку КУДА 11.3 в ТорчВижн.
- Чжункай Чжу исправил проблемы зависимости библиотеки JPEG (эта проблема вызвала серьезные проблемы у многих наших пользователей).
В процессе и на очереди
Есть много интересных новых функций, находящихся в стадии разработки, которые не вошли в этот выпуск. Вот некоторые из них:
- Мото Хира, Пармит Сингх Бхатия и я подготовили RFC, в котором предлагается новый механизм Версии модели и для обработки метаданных, связанных с предварительно обученными весами. Это позволит нам поддерживать несколько предварительно обученных весов для каждой модели и прикреплять к моделям связанную информацию, такую как метки, преобразования предварительной обработки и т. д.
- В настоящее время я работаю над использованием примитивов, добавленных «Батареи в комплекте”, чтобы повысить точность наших предварительно обученные модели. Цель состоит в том, чтобы достичь лучших в своем классе результатов для самых популярных предварительно обученных моделей, предоставляемых TorchVision.
- Филип Мейер и Франсиско Масса работают над захватывающим прототипом новой системы TorchVision. Набор данных и Превращает API.
- Прабхат Рой работает над расширением ядра PyTorch.
AveragedModel
класс для поддержки усреднение буферов кроме параметров. Отсутствие этой функции обычно считается ошибкой и будет включить многочисленные нижестоящие библиотеки и фреймворки, чтобы удалить свои собственные реализации EMA. - Адитья Оке написал утилиту который позволяет построение результатов моделей Keypoint на исходных изображениях (функция не попала в релиз, так как мы были загружены и не смогли вовремя просмотреть ее 🙁 )
- я строю прототип FX-утилиты который направлен на обнаружение остаточных соединений в произвольной архитектуре модели и изменение сети для добавления блоков регуляризации (таких как
StochasticDepth
).
Наконец, в нашем бэклоге есть несколько новых функций (скоро будут PR):
Я надеюсь, что приведенное выше резюме показалось вам интересным. Приветствуются любые идеи о том, как адаптировать формат серии блогов. Ударь меня по LinkedIn или Твиттер.