Александр Диков ML Engineer
NLP/CV

ML Engineer с 3 годами практического опыта в экспериментах, обучении моделей и разработки сервисов в NLP, CV и SciML.

Работаю на стыке прикладных исследований и ML-инженерии: проектирую и внедряю полный цикл решений от подготовки данных и построения пайплайнов до fine-tuning, инференса и мониторинга. Специализируюсь на NLP, CV и LLM-системах, включая агентные RAG-архитектуры для работы с документацией и сложными предметными знаниями. Перевожу исследовательские идеи в устойчивые практические решения с воспроизводимыми экспериментами, понятными метриками качества и инженерной надежностью в эксплуатации. Параллельно развиваю экспертизу в диффузионных и мультимодальных моделях, а также в MLOps-практиках.

Используемые технологии

PyTorch
Transformers
PEFT
OpenCV
LangChain/LangGraph
LangFuse/LangSmith
scikit-learn
scipy
numpy
pandas
ONNX
TensorRT
Triton
vLLM
Faiss/ChromaDB/Qdrant
Sphinx
Docker
Linux
Prometheus
Grafana
PostgreSQL
REST/gRPC API
fastapi/fastmcp

Репозитории

Ключевые проекты с акцентом на исследовательскую и прикладную ML-инженерию.

PINN

Public repository

Physics-Informed Neural Networks. Репозиторий с исследовательскими экспериментами, бэнчмарком и тестами различных вариаций физически-информативных нейронных сетей.

SciML PINN
Открыть

AtomRAG

Private repository

RAG-система по технической документации. Индексация, retrieval, генерация ответа, история чатов, запросов и ответов. Использование LangChain, semantic routing, агентного поиска и MCP. Разворачивание в облаке и в закрытом контуре, оптимизации использования токенов.

RAG LLM
Закрытый

dico

Private repository

Исследовательский репозиторий для статьи по diffusion LLM. Исследование влияния числа шагов генерации, resampling и других параметров, отвечающих за качество генерации.

NLP/CV Research
Закрытый

fine-tune-platform

Public repository

Платформа для экспериментов с fine-tuning и сравнения ML-моделей компьютерного зрения. Сделана в рамках хакатона "Лидеры цифровой трансформации".

Fine-tuning MLOps
Открыть

Репозитории с материалами курсов

  • MLCourse97 — материалы и практика по машинному обучению. Масштабный курс, охватывает основы машинного обучения, глубоких нейронных сетей, трансформеров и LLM-систем, а также различные домены
  • MLLearning — материалы для углубленного изучения NLP, CV и MLOps, а также для подготовки с собеседованиям по имплементации трансформеров from scratch.
  • PythonCourse — учебный репозиторий по Python. Основы Python, ООП, библиотеки, фреймворки и многое другое. Позволяет научиться решать базовые задачи на Python.
  • CppCourse — курс и упражнения по C++. Основы C++, ООП, алгоритмы и структуры данных. Позволяет научиться решать задачи на C++.
  • NumericalMethods — курс и упражнения по численным методам. Основы численных методов, решение уравнений, оптимизации, численное дифференцирование и интегрирование.

Репозитории с хакатонов и соревнований

  • T-Plexity — сервис по анализу инвестиционных новостей и персонализированным рекомендациям.
  • AtomicHack-AXIOM — сервис для анализа логов со сложных систем, а также выявления в них взаимосвязей между событиями.
  • fine-tune-platform — платформа для экспериментов с fine-tuning и сравнения ML-моделей компьютерного зрения. Сделана в рамках хакатона "Лидеры цифровой трансформации".
  • product-review-classifier-llm — сервис для классификации отзывов на продукты, используя LLM.
  • SiriusCV — сервис для удаления фона из изображений использующий модель семантической сегментации.
  • FlatPredictor — решение соревнования на Kaggle по предсказанию стоимости квартир в Москве, использует AutoML.
  • AXIOM-IProfiCCM — набор скриптов для решения задачи визуальной локализации.

Связаться со мной

↓ Проекты