ML-команда создает решения, которые помогают различным продуктам Positive Technologies автоматически детектировать, предотвращать угрозы и реагировать на них. Также активно облегчаем рутину наших коллег с помощью решений на основе LLM.
Общий стек технологий: classic NLP, LLMs, timeseries, Catboost, XGBoost, LightGBM, PyTorch, MLflow, Airflow, dvc, GitLab, Docker, Grafana, ClickHouse, PostgreSQL, Redis, Linux, Poetry, PyEnv, FastAPI
Сейчас мы ищем Senior ML-инженера для работы над задачами в рамках продукта Maxatrol SIEM.
MaxPatrol SIEM — это масштабируемая платформа сбора, анализа и корреляции событий информационной безопасности. MP SIEM выявляет сложные атаки и аномальное поведение в инфраструктуре заказчика. Продукт обрабатывает огромные объёмы логов в реальном времени и активно использует ML для автоматизации анализа угроз.
Чем предстоит заниматься
- Решать задачи поиска аномалий в табличных данных, в том числе с использованием статистических методов, классических ML-моделей и Deep Learning подходов
- Разрабатывать и внедрять NLP-решения: классификация событий безопасности, извлечение сущностей, семантический анализ логов и подозрительных событий
- Проектировать и реализовывать LLM-системы: объяснение доменных сущностей и терминов, интерпретация событий, расследование инцидентов кибербезопасности
- Вести полный цикл ML-разработки по методологии CRISP-DM: от понимания бизнес-задачи и подготовки данных до деплоя, мониторинга и переобучения моделей
- Обеспечивать воспроизводимость экспериментов, автоматизацию ETL-пайплайнов (через Airflow/MLflow), версионирование данных, моделей и метрик
- Писать читаемый, тестируемый и эффективный production-код на Python и участвовать в ревью — как в качестве автора, так и в роли рецензента
- Взаимодействовать с командами разработки и аналитики для интеграции ML-решений в продукт
Наши ожидания
- Опыт работы в роли ML инженера от 3 лет
- Уверенные знания классических и современных подходов в NLP, включая трансформеры и LLM
- Практический опыт работы с LLM: от продвинутых техник prompt engineering до тонкой настройки моделей (LoRA, QLoRA и пр.) и построения RAG-систем
- Опыт развёртывания моделей в продакшн: REST-микросервисы на Python, Docker
- Уверенные навыки программирования на Python (асинхронность, многопоточность/многопроцессность, тестирование)
- Знание основ Computer Science: алгоритмы, структуры данных, сложность операций
- Опыт работы с Linux, Docker, системами контроля версий (Git)
Будет плюсом
- Опыт проектирования и разработки highload-систем, работающих на Big Data стеке: Kubernetes, PySpark, Apache Flink, Kafka, и прочее
- Опыт оптимизации и развёртывания DL-моделей с помощью ONNX, OpenVINO, TorchScript для ускорения инференса
- Участие в исследованиях, публикации, выступления на конференциях или митапах
- Способность быстро осваивать новые технологии (языки, фреймворки, инструменты) и предлагать нестандартные решения
- Интерес не просто решать задачи, а улучшать продукт и процессы вокруг него — делать нашу работу проще, а MP SIEM — умнее и быстрее