Senior Software Engineer & AI Architect. Проектирую высоконагруженные Event-Driven системы и low-latency пайплайны для потоковой обработки медиаданных. Специализируюсь на глубокой интеграции LLM и аудио-шлюзов в real-time среды.

Инженерный профиль

Разрабатываю распределённые программные комплексы на стыке Game State Integration (GSI) и локальных LLM. Основной фокус — архитектура отказоустойчивых систем с нулевой задержкой (zero-latency pipelines) для обработки телеметрии и генерации контента в реальном времени.

Строго придерживаюсь принципов SOLID, чистой архитектуры и Single Source of Truth (SSOT). Имею глубокую экспертизу в построении мостов между ML-моделями (Ollama, Hugging Face) и конечным пользователем через асинхронные микросервисы (Python/FastAPI) и высокопроизводительные аудио-трансиверы (C#/.NET). Оптимизирую критические узлы, избегая излишней абстракции там, где требуется прямой доступ к памяти и сокетам.

Architecture Event-Driven & Microservices
Real-Time Zero-Latency Streaming

Технологический стек

AI & Audio Engineering

Local LLMs (Ollama / Qwen) Fish Speech TTS Engine C# / .NET 8 (NAudio) Raw PCM Audio Routing Semantic Token Chunking Jitter Buffers

Backend & Systems

Python 3.12 (Expert) AsyncIO / Multi-threading aiohttp / FastAPI Pydantic v2 (Data Validation) SQLAlchemy 2.0 (Core & ORM) Alembic (Migrations)

Infrastructure & Ops

Infrastructure as Code (IaC) Ansible / Terraform Docker & Compose Stack / Makefile PostgreSQL / pgvector Elasticsearch / Kibana Cloudflare Edge Config

Integration & Real-time

WebSocket (Real-time Push) OBS WebSocket 5.x Dota 2 GSI (High-level Parsing) Twitch EventSub / TwitchIO VTube Studio API (pyvts) REST & GraphQL APIs

Системная архитектура и проекты

High-Throughput Data Pipeline & IRC Scraper

Разработка отказоустойчивого парсера для непрерывного сбора датасетов под дообучение (LoRA) локальных LLM. Прямое подключение к IRC-шлюзам Twitch через чистые веб-сокеты для обхода ограничений API и анонимного агрегирования данных с десятков высоконагруженных каналов.

  • Raw Sockets: Использование aiohttp для прямой работы с wss://irc-ws.chat.twitch.tv, полное избавление от overhead-а сторонних библиотек и коллизий портов.
  • Real-time Filtering: Жёсткая эвристическая фильтрация мусорного трафика на лету с минимальным потреблением CPU.
  • Persistent Volumes: Бесшовная интеграция с Docker Volumes для потоковой записи JSONL-датасета на хост, гарантирующая сохранность данных при рестартах контейнера.
  • Microservice Isolation: Полностью независимый фоновый воркер, работающий в рамках единого Event-Driven цикла без блокировок основного ядра системы.
Python 3.12 aiohttp Raw IRC WebSockets Data Engineering LoRA Dataset Docker Volumes

Autonomous AI Streaming Pipeline (Lyralei Core)

Полностью асинхронный пайплайн для автономного ИИ-агента, взаимодействующего с аудиторией в прямом эфире. Архитектура объединяет LLM, TTS-движки, RAG-систему и обработку игрового состояния для генерации контекстно-зависимых реакций без задержек.

  • Semantic Streaming: Интеллектуальный парсинг токенов от локальной модели. Динамическое сегментирование фраз по смысловым блокам для немедленной генерации звука без ожидания полного ответа сети.
  • Raw PCM Audio Engine: Высокопроизводительный микросервис на C# (.NET 8) с использованием NAudio. Принимает бинарный аудиопоток по WebSockets и маршрутизирует его в виртуальные аудиоинтерфейсы.
  • Low-Latency GSI Hub: Асинхронная обработка GSI-пакетов (частота опроса 100мс). Идентификация ключевых игровых метрик для инициирования динамической смены контекста ИИ-агента.
  • Vector Memory (RAG): Имплементация долгосрочной памяти на базе PostgreSQL (pgvector) для хранения и быстрого поиска релевантного семантического контекста.
Python 3.12 C# .NET 8 Ollama / RAG Raw PCM WebSockets Game State Integration

Distributed Matchmaking Core

Высокодоступная распределённая система организации матчей, спроектированная по принципам Stateless Architecture. Контроль состояния вынесён в централизованный Single Source of Truth на базе MongoDB.

  • Distributed State Management: Использование атомарных транзакций БД для предотвращения Race Conditions при шардировании лобби в условиях высококонкурентного доступа.
  • Self-Healing Infrastructure: Реализация фоновых воркеров и Garbage Collector на базе TTL-индексов для автоматической резолюции дедлоков и очистки сиротских сессий.
  • Algorithm Engineering: Кастомный балансировщик (Snake Draft) с эвристической оценкой скрытого пула метрик и учётом ролевой синергии.
  • Ephemeral UX Pattern: Внедрение архитектуры на базе Interaction Tokens, радикально снижающей квоты обращений к внешним API.
Python 3.12 MongoDB (Atomic Ops) Distributed Systems Algorithmic Balancing Concurrency Control

Cloud Infrastructure & Edge Security

Проектирование и эксплуатация независимой облачной инфраструктуры. Архитектура построена по принципам Zero Trust и Attack Surface Reduction для безопасного деплоя ML-моделей и потоковых сервисов.

  • Strict Containment: Изоляция AI-моделей, баз данных и аналитических нодов в закрытых сетях Docker. Унифицированное управление деплоем через IaC и Makefile для детерминированного развёртывания сред.
  • Edge Defense: Интеграция Cloudflare и Nginx. Реализация агрессивного WAF, защита от L7-атак и обфускация топологии сети. Валидация всех входящих WebSocket-соединений и Webhook-пейлоадов.
  • Real-time Observability: Стек ELK (Elasticsearch/Kibana) для глубокого мониторинга бизнес-метрик, задержек генерации и аномалий в системных логах.
  • Resource Allocation: Балансировка вычислительной нагрузки на GPU/CPU в условиях ограничений облачного инстанса для поддержания стабильного TPS (Tokens Per Second).
Cloud Infrastructure Docker / Makefile Nginx / TLS 1.3 Cloudflare WAF Elastic Stack Zero Trust Security

Связь & Контакты

Открыт к обсуждению сложных архитектурных решений, проектирования высоконагруженных систем и нестандартных инженерных задач.