Data Scientist (Deep Learning)

30 мая 2024

З/П не указана

Город: Москва

Lamoda Tech

Город: Москва

Тип занятости: Полная занятость

Требуемый опыт: Опыт от 3 лет

Lamoda Tech

Тип занятости: Полная занятость

Требуемый опыт: Опыт от 3 лет

Обязанности:

Мы в поиске Data Scientist в команду AI Stylist. Наша цель – с помощью машинного обучения предоставить клиентам персонализированные визуальные решения по стилю, сочетанию вещей. Чем предстоит заниматься: Развивать визуальный поиск: разрабатывать алгоритмы детекции предметов одежды на фотографии, поиска по ассортименту актуальных товаров; Улучшать модели подбора комплектов товаров на основе визуальной сочетаемости; Обогащать атрибуты товаров: извлечение атрибутов из фотографий товаров, отзывов, генерация описаний с помощью нейронных сетей. Стэк технологий: Big data (Hadoop, PySpark, Hive), Python, Catboost, Airflow, Docker, SQL, PyTorch. Почему у нас классно: Мы аккредитованная IT-компания; Хорошо выстроенные процессы: квартальное планирование по методологии OKR, двухнедельные спринты, регулярные стендапы и проектные встречи для синхронизации; Сильная команда middle и senior специалистов, развитое DS-сообщество, где есть возможность обмениваться знаниями на внутренних митапах; У нас представлен полный жизненный цикл разработки data-driven продуктов с применением ML — от идеи и генерации гипотез до запуска АБ тестов. В части разработки онлайн-сервисов и деплоя моделей нам помогает команда инженеров. Мы ожидаем: Опыт в области анализа данных и машинного обучения (от 2 лет); Опыт работы с SQL, Hadoop, Hive, Spark; Владение Python, Linux, методами работы с большими данными; Опыт применения Deep Learning в задачах Computer Vision, NLP; Опыт работы с фреймворками глубокого обучения (мы используем PyTorch); Знания теории вероятностей и математической статистики; машинного обучения, прогнозного моделирования и методов статистического анализа; алгоритмов и структур данных; Высшее образование в области прикладной математики, информационных технологий, информатики и т.п; Английский язык на уровне технического чтения. Как мы работаем: Пишем на Python 3.6+ и PySpark 3.0; Для ресерча доступны два сервера (80 cores, 650Gb RAM), на которых развернут JupyrerHub и есть доступ к Hadoop-кластеру; Код с логикой ML-пайплайнов упаковываем в Docker и выкатываем, используя CI/CD-инструменты с запуском code style проверок и тестов; Используем Airflow для управления ML-пайплайнами и запуском их по расписанию; В командах есть культура code review как для изменений по части продакшен-пайплайнов, так и для ресерч-задач; Регулярно проводим командные брейнштормы с целью генерации новых идей по развитию наших data-driven продуктов; В компании внедрена культура принятия решений на основании данных и все изменения тестируем через a/b эксперименты.

Контакт:

Имя не указано

При звонке сообщите, что Вы нашли вакансию на Rabix.ru

Откликнуться

Разместить Резюме

Распечатать Пожаловаться ID: 114850417