Home Робототехника Как начать работу с машинным обучением в Джулии — | DeepTech

Как начать работу с машинным обучением в Джулии — | DeepTech

0
Как начать работу с машинным обучением в Джулии —
 | DeepTech

Что такое Джулия?

Julia — относительно новый язык программирования, вышедший в 2018 году. Это высокоуровневый и высокопроизводительный язык. Высокий уровень означает, что он использует элементы естественного языка, его проще использовать и он более понятен, чем язык низкого уровня. Философия дизайна, лежащая в основе этого языка, заключалась в том, чтобы сделать его таким же быстрым, как C и C++, и при этом простым в использовании, как Python. Джулия отлично подходит для решения сложных задач. Некоторые области, которые рано начали использовать Джулию, — это биология, химия и машинное обучение. Джулию также можно использовать для других задач, таких как разработка игр и веб-разработка.

Зачем использовать Джулию?

Почему мы должны использовать Julia для машинного обучения, если другие языки, такие как Python, уже существуют? Ну, во-первых, главное преимущество Julia перед другими языками в этой области — это скорость. Он имеет такое преимущество в скорости, поскольку компилируется и предназначен для параллелизма. Julia — язык высокого уровня, поэтому у него нет сложного синтаксиса, как у других языков, таких как Java. Это позволяет программистам Python легко переключиться на Julia. Наконец, Julia все еще относительно нова, поэтому она продолжает расти и каждый день к ней добавляются новые библиотеки. Поскольку это открытый исходный код, любой может создать новую библиотеку!

Начало работы с Юлией

Прежде чем начать с Джулии, нам нужно сначала скачать приложение, которое сможет ее запустить. Одно из таких приложений известно как блокнот Jupyter. Jupyter Notebook — это интегрированная среда разработки или IDE с открытым исходным кодом. IDE — это просто программное обеспечение, которое помогает программистам легче писать и разрабатывать код. Обычно он содержит редактор исходного кода, инструменты автоматизации и отладчик. Как правило, их гораздо проще использовать людям, впервые знакомым с языком. Блокнот Jupyter можно скачать на официальном сайте Project Jupyter. https://jupyter.org/.

Далее вам нужно будет скачать Юлю с их официального сайта, https://julialang.org/downloads/. После загрузки, чтобы добавить Julia в блокнот Jupyter, вам нужно сначала открыть командную строку Julia. Как только он откроется, вы вводите команду «using Pkg» и нажимаете Enter. После этого введите команду «Pkg.add(»IJulia») и нажмите Enter. Установка займет некоторое время. Как только это будет сделано, вы можете открыть блокнот IDE Jupyter, нажать «Создать» в правом верхнем углу экрана и выбрать оттуда «Джулия». Поздравляем, теперь вы можете начать программировать с помощью Julia!

Подготовка данных для Джулии

Прежде чем мы сможем начать использовать Julia для машинного обучения, мы сначала должны подготовить набор данных. В следующих примерах я буду использовать набор данных Iris. Его можно найти на сайте https://archive.ics.uci.edu/ml/datasets/iris. Существует три различных способа импорта и подготовки данных. Этими способами являются импорт CSV-файла, горячее кодирование категориальной переменной и разделение поезд-тест. Более подробно методы описаны ниже.

  • Импорт файла CSV. Файл CSV означает файл, разделенный запятыми, и представляет собой просто файл, который позволяет структурировать данные в табличном формате. Чтобы импортировать CSV-файл в Julia, сначала необходимо добавить библиотеки «DataFrames» и «CSV». После этого вы просто используете встроенную функцию «CSV.file», чтобы прочитать файл CSV и преобразовать его в фрейм данных. Код ниже показывает, как это сделать.
  • Горячее кодирование категориальной переменной. В некоторых случаях вам может потребоваться использовать одну горячую кодировку для категориальных переменных. С помощью one-hot мы конвертируем каждое категориальное значение в новый категориальный столбец и присваиваем этим столбцам двоичное значение 1 или 0. Библиотека, используемая для этого, называется «Lathe». Мы используем эту библиотеку, потому что в нее уже встроена одна функция горячего кода. Ниже приведен пример.
  • Тестовый сплит поезда. Разделение тестов поезда используется для оценки производительности алгоритма машинного обучения. Его также можно использовать для оценки модели. Используемая библиотека называется «Random». Эта библиотека очень большая, чтобы узнать больше о ней, посетите официальный сайт здесь. https://docs.julialang.org/en/v1/stdlib/Random/. Ниже приведен пример разделения тестового поезда.

Машинное обучение с использованием Джулии

Теперь, когда вся подготовка данных завершена, мы наконец можем начать использовать Julia для машинного обучения. Поскольку Julia все еще является относительно новым языком, в нем не так много библиотек, как в других языках, таких как Python. В этой статье речь пойдет о двух крупнейших библиотеках Julia: MLJ и Scikit Learn.

  • Scikit Узнайте. Если вы знакомы с Python, вы узнаете эту библиотеку. Он содержит множество классификаций, алгоритмов кластеризации и регрессий в Python и аналогично работает в Julia. Ниже приведен пример использования Scikit Learn для логистической регрессии. «Подходит!» синтаксис используется для обучения модели.
  • MLJ означает машинное обучение в Julia и предоставляет алгоритмы для настройки, выбора, составления, оценки и сравнения более 100 моделей машинного обучения. Эта библиотека уникальна для Джулии и поддерживается Фондом Алана Тьюринга. Подробнее о MLJ можно узнать на официальном сайте. https://juliapackages.com/p/mlj. Есть некоторые различия при использовании MLJ. Например, вы должны загрузить модель с помощью команды «using» вместо импорта пакетов, как это делает Python. Ниже приведен пример MLJ:
Источник: YouTube

Заключение

Язык Julia все еще развивается, но его легко освоить тем, кто уже знаком с Python. Библиотека MLJ могла бы сделать Джулию лидером в мире машинного обучения, обогнав Python. Однако прежде чем он сможет добиться этого, ему все еще нужно больше доверия и поддержки со стороны сообщества. Я надеюсь, что эта статья научила вас немного тому, с чего начать изучение Джулии. Спасибо за чтение.

Статистика с Джулией: основы науки о данных, машинного обучения и искусственного интеллекта (серия Springer по наукам о данных)

Рекомендации

Килпатрик, Логан. «Изучите Julia для начинающих — объяснение будущего языка программирования для науки о данных и машинного обучения». FreeCodeCamp.orgFreeCodeCamp.org, 28 декабря 2021 г., https://www.freecodecamp.org/news/learn-julia-programming-language/.

Туйчиев, Бехруз. «Расцвет языка программирования Julia — стоит ли его изучать в 2022 году?» ДатакемпDataCamp, 19 мая 2022 г., https://www.datacamp.com/blog/the-rise-of-julia-is-it-worth-learning-in-2022.

LEAVE A REPLY

Please enter your comment!
Please enter your name here