Usluge
Šta radim za klijente.
Backend, AI integracije, RAG sistemi i nezahvalan posao dovođenja AI-generisanog koda u produkcijsko stanje. Nezavisni izvođač, async-first, klijenti iz US / AU / EU.
-
Sajtovi i landing strane
Brzi, višejezični, SEO-spremni — Lighthouse 100/100/100/100.
Marketing sajtovi, produktni landing-i, višejezični portfoliji. Astro / Next / Vue + Tailwind, deploy preko Docker + Traefik, puna mikrostruktura, sitemap-i, RSS, OG slike i i18n. Živi primeri — ovaj sajt (vbcherepanov.com) i totalmemory.dev.
Šta dobijate
- Astro / Next.js / Vue + Tailwind — izbor po obliku sadržaja, ne po hype-u.
- JSON-LD (WebSite / Person / Article / Service), sitemap po tipu sadržaja, hreflang, OG.
- Lighthouse 100 / Core Web Vitals zeleno / WCAG AA / cookie banner koji poštuje izbor.
- Višejezičnost (en/ru/sr ili bilo koji par) sa content collections i ispravnim canonical URL-ovima.
- CI/CD: GitLab ili GitHub Actions, Docker multi-stage, Traefik / nginx, zero-downtime deploy.
Stack
- Astro
- Next.js
- Vue / Nuxt
- Tailwind
- Docker
- Traefik
- GitLab CI
-
Backend servisi i API
Go i PHP/Symfony servisi koji preživljavaju produkciju.
REST + gRPC servisi, OAuth2/OIDC identity, message-driven jezgra, PostgreSQL/Redis/RabbitMQ. Clean architecture (handler ≤15 linija → service → repo), domain errors, strukturni log-ovi, metrike + tracing — ugrađeno od prvog commit-a, a ne posle prvog incidenta.
Šta dobijate
- Go 1.25+ ili PHP 8.4 / Symfony 8.0 — bira se po timu i opterećenju.
- PostgreSQL 18: dizajn šeme, migracije, strategija indeksa, keyset paginacija.
- Event-driven sa RabbitMQ / NATS / Kafka, idempotency ključevi, outbox pattern.
- OpenAPI / gRPC ugovori, code-gen, contract testovi, bez `any`/`mixed` za business podatke.
- Observability: Prometheus + strukturni slog/Monolog + OpenTelemetry trace-ovi.
Stack
- Go
- PHP / Symfony
- PostgreSQL
- RabbitMQ
- gRPC
- OpenAPI
- OAuth2/OIDC
-
AI integracija
Ugrađujem LLM u proizvod — bez demo-grade krhkosti.
OpenAI, Anthropic, DeepSeek i lokalni modeli (Ollama, llama.cpp, LM Studio), integrisani u backend kroz structured output, tool/function-calling, streaming, retry-eve, cost-aware routing i punu observability. Multi-provider odmah — bez vendor lock-in-a.
Šta dobijate
- Provider apstrakcija (Anthropic / OpenAI / DeepSeek / local) sa determinističkim fallback-om.
- Tool calling, structured JSON output (zod / pydantic), streaming SSE / WebSocket.
- Budžeti tokena i troškova po zahtevu / korisniku / feature-u — metrike u Prometheus.
- Verzionisanje prompt-ova, eval harness, golden-set regression testovi na svaku izmenu.
- Bezbednost: PII redaction, prompt-injection hardening, content filteri, audit log po pozivu.
Stack
- Anthropic
- OpenAI
- Ollama
- MCP
- Function calling
- Structured output
-
RAG sistemi
Retrieval koji zaista pronalazi — isti recept kao u total-agent-memory (R@5 = 97 %).
Produkcijski RAG pipeline-i koji nadmašuju naivni cosine-similarity baseline: hibridni 6-tier retrieval (FTS5/BM25 + embeddings + fuzzy + graph + cross-encoder + MMR), chunking koji poštuje semantiku, evaluacija na LongMemEval-style setovima. Ista arhitektura koja je u total-agent-memory sa R@5 = 97 %.
Šta dobijate
- Vector store-ovi: pgvector (Postgres-native), Qdrant, FAISS — po skali i ops modelu.
- Hibridni retrieval: BM25 + dense + sparse + reranker (BGE-v2-m3 / Cohere / cross-encoder).
- Ingestion pipeline: parseri po formatima, semantic chunking, reuse embeddings-a, dedup.
- Evaluacija: LongMemEval / LoCoMo / vaš golden-set, R@K + nDCG praćeni kroz vreme.
- Iznad — knowledge graph sloj: entiteti, relacije, vremenske činjenice (Allen algebra).
Stack
- pgvector
- Qdrant
- BGE / Cohere
- Hybrid retrieval
- Eval harness
- MCP
-
Sređivanje koda nakon AI-a
Pretvaram vibe-coded haos u kod koji možeš da pustiš u prod i održavaš.
Agent je generisao pola projekta i sada to «otprilike radi», «otprilike kompajlira», «otprilike testovi rade». Prolazim forenzikom: ubijam half-done stub-ove, izvlačim hardcode u konfiguraciju, odvajam domain od infrastrukture, pišem prave testove umesto `// TODO: test`, vraćam arhitekturu u stanje koje čovek može da razvija.
Šta dobijate
- Inventar: TODO/FIXME/XXX/HACK/NotImplemented/stub/panic("todo") — dovršiti ili implementirati.
- Hardcode URL/IP/tajne/magični brojevi → env, config, imenovane konstante.
- Demo / mock podaci se izbacuju iz prod putanja, premeštaju u fixtures / seeds / factories.
- Arhitektura se vraća u slojeve: handler ≤15 linija → service → repo, tipizirani DTO-ovi.
- Pravi testovi (unit + integration + golden + regression) — ne fajlovi puni `assert true`.
- Security prolaz: SQL/SSRF/XSS, zaboravljene admin rute, slab auth, tajne u istoriji repozitorijuma.
Stack
- Refactoring
- Tests
- Security audit
- Architecture review
- CI/CD
-
Podesićemo AI agente da pišu produkcijski kod
Claude Code / Cursor / Codex / Cline — sa memorijom, hooks, MCP i feedback loop-om koji hvata halturu pre tebe.
Većina timova koristi coding agente na 10 % njihovih mogućnosti — bez memorije, hooks-a, pravila projekta i bez verifikacionog ciklusa. Postavljam isti stek koji koristim sam: total-agent-memory za cross-session znanje, a2abridge za multi-agent koordinaciju, CLAUDE.md / .cursorrules sa pravim arhitektonskim pravilima, hooks koji kontrolišu izmene, i feedback loop (testovi/build/lint) nakon svake izmene.
Šta dobijate
- MCP serveri: total-agent-memory (trajno znanje), filesystem, A2A bridge.
- CLAUDE.md / .cursorrules / AGENTS.md sa pravim arhitektonskim, code-quality i git pravilima.
- Hooks: pre-edit guards, post-edit lint/test, memory_save reminders, no-stub enforcement.
- Multi-agent setup: Claude + Codex / DeepSeek / local Llama u stilu AISWARM orkestracije.
- Feedback loop: testovi + build + lint + grep na svaku izmenu; agent ne piše "DONE" dok je crveno.
- Hand-over: pisani playbook za tim + 1h walkthrough poziv.
Stack
- Claude Code
- Cursor
- Codex
- MCP
- total-agent-memory
- a2abridge
- AISWARM
-
Konsalting za arhitekturu i strategiju
Drugo mišljenje o stack-u, arhitekturi, AI strategiji — po satu ili fiksno.
Kratak, fokusiran angažman kada vam treba senior pogled spolja: izbor stack-a, arhitektonski review, performance audit, AI strategija, hiring signal. Rezultat — pisani brief sa konkretnim preporukama poređanim po ROI-ju, sa pokazivačima na kod gde je relevantno.
Šta dobijate
- Izbor stack-a: Go vs PHP vs Node, Postgres vs Mongo, izbor reda — sa trade-off-ima.
- Arhitektonski review: layered vs hexagonal vs microservices, gde je stvarno bottleneck.
- AI strategija: gde LLM-ovi pomažu, gde koštaju više nego što štede, build-vs-buy.
- Performance audit: profiling, query planovi, cache strategija, async vs sync.
- Hiring signal: čitam kod kandidata, vodim live design review.
- Format: 1h poziv → pisani brief, ili 1-dnevni on-site / paired session.
Stack
- Architecture review
- AI strategy
- Stack selection
- Performance audit
- Hiring