Мы используем файлы cookie, чтобы обеспечивать правильную работу нашего веб-сайта и анализировать сетевой трафик.
Согласие на обработку и политика в отношении персональных данных

Мы используем файлы cookie. Подробнее

Для работы с нашим сайтом необходимо, чтобы Вы включили JavaScript в вашем браузере.

Соискателям

Работодателям

Готовое резюме

Репетиция собеседования

Все сервисы

Middle/Senior Data Scientist в команду NLP Core

Уровень дохода не указан

Опыт работы: 3–6 лет

Полная занятость

График: 5/2

Рабочие часы: 8

Формат работы: удалённо

Откликнуться

2ГИС

Открытый

Показывает отзывы от сотрудников

5-е место

В Рейтинге работодателей hh.ru

IT-компания

У работодателя есть аккредитация

Привет! Мы – команда NLP Core, специализируемся на актуализации и сборе данных о компаниях.

Работая с неструктурированной и сложной информацией, мы превращаем хаос данных в структурированные и качественные информационные потоки, обеспечивая высокую точность, полноту и актуальность контента в продукте. Наша работа напрямую влияет на качество сервиса и лояльность пользователей. Мы разрабатываем алгоритмические и ML-решения для автоматизации задач, применяя весь спектр инструментов NLP стека: от расстояния Левенштейна и линейных моделей до коммерческих LLM и их локальных аналогов.

Мы расширяем команду и ищем NLP-инженера которому интересно работать с большими и сложными наборами данных, развивать ML-решения, структурируя их и приводя в порядок.

Какие задачи мы решаем

Извлечение атрибутов и характеристик – автоматическое выделение параметров товаров и данных о компаниях.
Предсказание категорий – автоматическая классификация товаров и организаций на основе их описаний и характеристик.
Поиск и расширение семантических связей – выявление связей между товарами, рубриками и компаниями для улучшения поисковых алгоритмов.
Оптимизация рубрикатора – работа с ключевыми словами, их синонимами и частотностью для улучшения качества поисковой выдачи.
Нормализация и дедубликация данных – приведение информации к единому формату.
Модерация данных – работа над качеством и релевантностью товаров и отзывов.

Наши ожидания от кандидата

Опыт работы с NLP-задачами 3+ лет.
Углубленные знания современных и классических архитектур и моделей обработки естественного языка.
Опыт работы с PyTorch, HF Transformers и основными библиотеками для обработки данных, текста и ML/DL.
Отличное знание Python и опыт создания ML-сервисов.
Готовность работать на всех этапах разработки: от анализа проблемы и проведения экспериментов до оценки решений и их реализации в виде сервисов.

Будет крутым бонусом

Опыт работы с CI/CD и инфраструктурой: Docker, Kubernetes, Kafka, FastAPI.
Навыки интеграции и деплоя ML-моделей в продуктовые серверные приложения.
Знание принципов оптимизации ML/DL-моделей: ONNX, Triton, FasterTransformer и др.
Опыт работы с инструментами для разработки LLM инфраструктуры: vLLM, LangChain, LlamaIndex.

Почему стоит к нам присоединиться

Сложные задачи в реальном продукте — сотни тысяч организаций, горы связанных с ними данных разной степени структурированности.
Свобода выбирать технологии — мы используем как классические алгоритмы так и передовые ML решения.
Влияние на продукт — разрабатываемые нами решения улучшают пользовательский опыт в продуктах компании.
Сильная команда — с которой можно расти и умножать свои знания, принося общий вклад.
Фокус на исследования — в первую очередь мы занимаемся поиском оптимальных подходов по качеству и производительности.

Почему у нас классно

2ГИС – аккредитованная IT-компания.
Можно работать удалённо. Для нас важен специалист, а не его локация. Если хочешь работать в гибридном формате, есть офисы в Москве, Санкт-Петербурге, два классных офиса в Новосибирске. А также коворкинги в Нижнем Новгороде, Томске, Астане, Алма-Ате.
Само собой, полностью белая зарплата.
Заботимся о здоровье: ДМС и возможность получать онлайн-консультации и терапевта, невролога, психолога и медицинского агента.
Если хочешь делиться своим опытом, мы только за — поможем с выступлениями на конференциях и статьями для Хабра/VC.
Есть собственный учебный центр: курсы, тренинги и книги для прокачки скиллов.

ООО «ДубльГИС» представляет бренд 2ГИС

Делаем карту, справочник и навигатор. А ещё — API и SDK, сервис бронирования Отелло, 2ГИС Про для бизнеса, оплату на АЗС и даже роботов.

Ключевые навыки

PyTorch
NLP
LLM
HF Transformers
Deep Learning

Задайте вопрос работодателю

Он получит его с откликом на вакансию

Где располагается место работы?

Какой график работы?

Вакансия открыта?

Какая оплата труда?

Как с вами связаться?

Другой вопрос

Вакансия опубликована 18 марта 2025 в Санкт-Петербурге

Middle/Senior Data Scientist в команду NLP Core

Напишите телефон, чтобы работодатель мог связаться с вами

Ключевые навыки

Задайте вопрос работодателю

Отзывы о компании

Похожие вакансии в этой компании

Похожие вакансии