Skip to main content

Usluge

Šta radim za klijente.

Backend, AI integracije, RAG sistemi i nezahvalan posao dovođenja AI-generisanog koda u produkcijsko stanje. Nezavisni izvođač, async-first, klijenti iz US / AU / EU.

Format
Fixed-price angažmani ili po satu. Cena na zahtev.
Pravna forma
B2B ugovori preko srpskog preduzetnika (Vitalii Cherepanov PR Novi Sad, PIB 115184071). Faktura u EUR ili RSD.
Proces
Email → 30-min discovery poziv → pisani predlog → ugovor → isporuka.
  • Sajtovi i landing strane

    Brzi, višejezični, SEO-spremni — Lighthouse 100/100/100/100.

    Marketing sajtovi, produktni landing-i, višejezični portfoliji. Astro / Next / Vue + Tailwind, deploy preko Docker + Traefik, puna mikrostruktura, sitemap-i, RSS, OG slike i i18n. Živi primeri — ovaj sajt (vbcherepanov.com) i totalmemory.dev.

    Šta dobijate

    • Astro / Next.js / Vue + Tailwind — izbor po obliku sadržaja, ne po hype-u.
    • JSON-LD (WebSite / Person / Article / Service), sitemap po tipu sadržaja, hreflang, OG.
    • Lighthouse 100 / Core Web Vitals zeleno / WCAG AA / cookie banner koji poštuje izbor.
    • Višejezičnost (en/ru/sr ili bilo koji par) sa content collections i ispravnim canonical URL-ovima.
    • CI/CD: GitLab ili GitHub Actions, Docker multi-stage, Traefik / nginx, zero-downtime deploy.

    Stack

    • Astro
    • Next.js
    • Vue / Nuxt
    • Tailwind
    • Docker
    • Traefik
    • GitLab CI
  • Backend servisi i API

    Go i PHP/Symfony servisi koji preživljavaju produkciju.

    REST + gRPC servisi, OAuth2/OIDC identity, message-driven jezgra, PostgreSQL/Redis/RabbitMQ. Clean architecture (handler ≤15 linija → service → repo), domain errors, strukturni log-ovi, metrike + tracing — ugrađeno od prvog commit-a, a ne posle prvog incidenta.

    Šta dobijate

    • Go 1.25+ ili PHP 8.4 / Symfony 8.0 — bira se po timu i opterećenju.
    • PostgreSQL 18: dizajn šeme, migracije, strategija indeksa, keyset paginacija.
    • Event-driven sa RabbitMQ / NATS / Kafka, idempotency ključevi, outbox pattern.
    • OpenAPI / gRPC ugovori, code-gen, contract testovi, bez `any`/`mixed` za business podatke.
    • Observability: Prometheus + strukturni slog/Monolog + OpenTelemetry trace-ovi.

    Stack

    • Go
    • PHP / Symfony
    • PostgreSQL
    • RabbitMQ
    • gRPC
    • OpenAPI
    • OAuth2/OIDC
  • AI integracija

    Ugrađujem LLM u proizvod — bez demo-grade krhkosti.

    OpenAI, Anthropic, DeepSeek i lokalni modeli (Ollama, llama.cpp, LM Studio), integrisani u backend kroz structured output, tool/function-calling, streaming, retry-eve, cost-aware routing i punu observability. Multi-provider odmah — bez vendor lock-in-a.

    Šta dobijate

    • Provider apstrakcija (Anthropic / OpenAI / DeepSeek / local) sa determinističkim fallback-om.
    • Tool calling, structured JSON output (zod / pydantic), streaming SSE / WebSocket.
    • Budžeti tokena i troškova po zahtevu / korisniku / feature-u — metrike u Prometheus.
    • Verzionisanje prompt-ova, eval harness, golden-set regression testovi na svaku izmenu.
    • Bezbednost: PII redaction, prompt-injection hardening, content filteri, audit log po pozivu.

    Stack

    • Anthropic
    • OpenAI
    • Ollama
    • MCP
    • Function calling
    • Structured output
  • RAG sistemi

    Retrieval koji zaista pronalazi — isti recept kao u total-agent-memory (R@5 = 97 %).

    Produkcijski RAG pipeline-i koji nadmašuju naivni cosine-similarity baseline: hibridni 6-tier retrieval (FTS5/BM25 + embeddings + fuzzy + graph + cross-encoder + MMR), chunking koji poštuje semantiku, evaluacija na LongMemEval-style setovima. Ista arhitektura koja je u total-agent-memory sa R@5 = 97 %.

    Šta dobijate

    • Vector store-ovi: pgvector (Postgres-native), Qdrant, FAISS — po skali i ops modelu.
    • Hibridni retrieval: BM25 + dense + sparse + reranker (BGE-v2-m3 / Cohere / cross-encoder).
    • Ingestion pipeline: parseri po formatima, semantic chunking, reuse embeddings-a, dedup.
    • Evaluacija: LongMemEval / LoCoMo / vaš golden-set, R@K + nDCG praćeni kroz vreme.
    • Iznad — knowledge graph sloj: entiteti, relacije, vremenske činjenice (Allen algebra).

    Stack

    • pgvector
    • Qdrant
    • BGE / Cohere
    • Hybrid retrieval
    • Eval harness
    • MCP
  • Sređivanje koda nakon AI-a

    Pretvaram vibe-coded haos u kod koji možeš da pustiš u prod i održavaš.

    Agent je generisao pola projekta i sada to «otprilike radi», «otprilike kompajlira», «otprilike testovi rade». Prolazim forenzikom: ubijam half-done stub-ove, izvlačim hardcode u konfiguraciju, odvajam domain od infrastrukture, pišem prave testove umesto `// TODO: test`, vraćam arhitekturu u stanje koje čovek može da razvija.

    Šta dobijate

    • Inventar: TODO/FIXME/XXX/HACK/NotImplemented/stub/panic("todo") — dovršiti ili implementirati.
    • Hardcode URL/IP/tajne/magični brojevi → env, config, imenovane konstante.
    • Demo / mock podaci se izbacuju iz prod putanja, premeštaju u fixtures / seeds / factories.
    • Arhitektura se vraća u slojeve: handler ≤15 linija → service → repo, tipizirani DTO-ovi.
    • Pravi testovi (unit + integration + golden + regression) — ne fajlovi puni `assert true`.
    • Security prolaz: SQL/SSRF/XSS, zaboravljene admin rute, slab auth, tajne u istoriji repozitorijuma.

    Stack

    • Refactoring
    • Tests
    • Security audit
    • Architecture review
    • CI/CD
  • Podesićemo AI agente da pišu produkcijski kod

    Claude Code / Cursor / Codex / Cline — sa memorijom, hooks, MCP i feedback loop-om koji hvata halturu pre tebe.

    Većina timova koristi coding agente na 10 % njihovih mogućnosti — bez memorije, hooks-a, pravila projekta i bez verifikacionog ciklusa. Postavljam isti stek koji koristim sam: total-agent-memory za cross-session znanje, a2abridge za multi-agent koordinaciju, CLAUDE.md / .cursorrules sa pravim arhitektonskim pravilima, hooks koji kontrolišu izmene, i feedback loop (testovi/build/lint) nakon svake izmene.

    Šta dobijate

    • MCP serveri: total-agent-memory (trajno znanje), filesystem, A2A bridge.
    • CLAUDE.md / .cursorrules / AGENTS.md sa pravim arhitektonskim, code-quality i git pravilima.
    • Hooks: pre-edit guards, post-edit lint/test, memory_save reminders, no-stub enforcement.
    • Multi-agent setup: Claude + Codex / DeepSeek / local Llama u stilu AISWARM orkestracije.
    • Feedback loop: testovi + build + lint + grep na svaku izmenu; agent ne piše "DONE" dok je crveno.
    • Hand-over: pisani playbook za tim + 1h walkthrough poziv.

    Stack

    • Claude Code
    • Cursor
    • Codex
    • MCP
    • total-agent-memory
    • a2abridge
    • AISWARM
  • Konsalting za arhitekturu i strategiju

    Drugo mišljenje o stack-u, arhitekturi, AI strategiji — po satu ili fiksno.

    Kratak, fokusiran angažman kada vam treba senior pogled spolja: izbor stack-a, arhitektonski review, performance audit, AI strategija, hiring signal. Rezultat — pisani brief sa konkretnim preporukama poređanim po ROI-ju, sa pokazivačima na kod gde je relevantno.

    Šta dobijate

    • Izbor stack-a: Go vs PHP vs Node, Postgres vs Mongo, izbor reda — sa trade-off-ima.
    • Arhitektonski review: layered vs hexagonal vs microservices, gde je stvarno bottleneck.
    • AI strategija: gde LLM-ovi pomažu, gde koštaju više nego što štede, build-vs-buy.
    • Performance audit: profiling, query planovi, cache strategija, async vs sync.
    • Hiring signal: čitam kod kandidata, vodim live design review.
    • Format: 1h poziv → pisani brief, ili 1-dnevni on-site / paired session.

    Stack

    • Architecture review
    • AI strategy
    • Stack selection
    • Performance audit
    • Hiring