Data Science

4 нед. назад

В открытый доступ вышла крутейшая книга по машинному обучению — целый год фундаментальный труд Себастьяна Рашки можно было купить только на Амазоне, но теперь она доступна для всех.

Что внутри:

• ОГРОМНЫЙ сборник тем по Deep Learning.
• Целых 30 глав отборной, понятной и подробной инфы: компьютерному зрению, LLM, эвалу и методам деплоя моделей.
• Тонны практики, примеров — автор все объясняет на схемах и картинках.
• Упражнения после каждой главы.

#ml #deeplearning #llm #learn #machinelearning

https://sebastianraschka.com/b....ooks/ml-q-and-ai/#ta

Мне нравится

Комментарий

Поделиться

3 лет - Youtube

Машинное обучение. Рекомендательные системы. К.В. Воронцов, Школа анализа данных, Яндекс.

Имеются транзакционные данные о предпочтениях объектов клиентами. Требуется для заданного клиента спрогнозировать, какие объекты для него наиболее предпочтительны. Простые и уже устаревшие методы коллаборативной фильтрации основаны на поиске схожих клиентов, которые предпочитают схожие множества объектов. Более современные методы основаны на поиске латентных векторов интересов клиентов и объектов. Для этого используются методы матричных разложений. Качество рекомендаций измеряется многими критериями: это не только точность предсказания известных предпочтений, но и разнообразие, новизна, покрытие, догадливость. Кроме того, рекомендательная система должна обеспечивать адекватность рекомендаций даже в условиях «холодного старта», когда по объекту или по клиенту не хватает информации о предпочтениях.

#datascience #deeplearning #machinelearning #learn

Мне нравится

Комментарий

Поделиться

3 лет - Youtube

Машинное обучение. Обучение ранжированию. К.В. Воронцов, Школа анализа данных, Яндекс.

Задача ранжирования отличается от классификации и регрессии тем, что вместо правильных ответов на объектах обучающей выборке задаётся отношение частичного порядка. Модель ранжирования – это функция от объекта (как и в задаче регрессии), с помощью которой можно отранжировать произвольное множество объектов. Задачи ранжирования решаются в информационно-поисковых, рекламных и рекомендательных системах. Критерии качества ранжирования весьма разнообразны, наиболее важные из них рассматриваются в лекции. Методы обучения ранжированию делятся на три большие группы: поточеченые, попарные и списочные. Поточечные являются незначительными модификациями методов классификации или регрессии. Попарные оптимизируют критерии, представляющие собой сумму по парам объектов, а не по отдельным объектам. Для оптимизации часто используется метод стохастического градиента. Списочные методы приближённо оптимизируют качество ранжирования в списках поисковой выдачи.

#datascience #deeplearning #machinelearning #learn

Мне нравится

Комментарий

Поделиться

3 лет - Youtube

Машинное обучение. Композиции классификаторов, часть 2. К.В. Воронцов, Школа анализа данных, Яндекс.

Бэггинг похож на бустинг, но использует простое голосование вместо взвешенного, бутстрепинг объектов обучающей выборки вместо их перевзвешивания, независимое параллельное построение базовых алгоритмов вместо строго последовательного. По критерию качества бустинг, бэггинг и случайные леса, как правило, сопоставимы. Во многих приложениях базовые алгоритмы проще обучать на отдельных частях признакового пространства, называемых областями компетенции. Такие методы похожи на восстановление смеси распределений и используют ЕМ-подобные алгоритмы для поочерёдной оптимизации базовых алгоритмов и их областей компетенции.

#datascience #deeplearning #machinelearning #learn

Мне нравится

Комментарий

Поделиться

3 лет - Youtube

Машинное обучение. Линейные композиции, бустинг. К.В. Воронцов, Школа анализа данных, Яндекс.

Композиционные методы машинного обучения дают положительный конструктивный ответ на вопрос, возможно ли из большого числа ненадёжных алгоритмов построить один надёжный. Алгоритм AdaBoost строит последовательность алгоритмов так, чтобы каждый следующий стремился исправлять ошибки предыдущих. В AdaBoost используется экспоненциальная аппроксимация пороговой функции потерь и дискретно-значные базовые классификаторы. Градиентный бустинг обобщает эту идею и позволяет использовать произвольную функцию потерь и вещественно-значные базовые алгоритмы. С помощью градиентного бустинга можно решать задачи регрессии и ранжирования. Алгоритмы MatrixNet и CatBoost, разработанные в Яндексе, представляют собой градиентный бустинг над решающими деревьями специального вида.

#datascience #deeplearning #machinelearning #learn

Мне нравится

Комментарий

Поделиться

Информация

2 участника (-ов)
Открытая группа
Языки программирования
26 сообщений

О проекте

Data science is an interdisciplinary field that uses scientific methods, processes, algorithms and systems to extract knowledge and insights from noisy, structured and unstructured data, and apply knowledge and actionable insights from data across a broad range of application domains.