Răspuns instant la FAQ
Întrebări despre program, livrare, retur, garanție, prețuri, disponibilitate stoc, modalități de plată. Răspunde cu cuvintele tale, nu generic. Antrenat pe documentele firmei tale, nu pe internet random.
Ce poate face
Întrebări despre program, livrare, retur, garanție, prețuri, disponibilitate stoc, modalități de plată. Răspunde cu cuvintele tale, nu generic. Antrenat pe documentele firmei tale, nu pe internet random.
Pune întrebări calificative (buget, urgență, dimensiune firmă, nevoie specifică), filtrează lead-urile, le marchează cu scoring și le trimite în CRM-ul tău (HubSpot, Pipedrive, Notion) cu toate datele structurate gata de follow-up.
Verifică calendarul tău (Google Calendar / Calendly / Setmore), oferă sloturi libere, rezervă direct, trimite confirmare prin email și SMS, adaugă reminder cu 24h înainte. Anulare sau reprogramare tot prin chat.
Status comandă (interogare directă în baza ta de date), informații livrare (tracking Sameday/FAN/DPD), inițiere retur cu generare AWB, troubleshooting de bază pe produse. 60-80% din ticketele tipice rezolvate fără om.
Detectează când nu știe sau când clientul cere expres („vreau un consultant”), transferă conversația completă către echipa ta (Slack, email, WhatsApp intern, sau direct în CRM) sau programează callback dacă suntem în afara orarului.
Pune câteva întrebări despre nevoie, buget, preferințe, apoi recomandă din catalogul tău cu link direct la pagină + motivare („l-am ales pentru că X”). Excelent pentru magazine cu catalog mare unde clientul se pierde.
Stack LLM
Ideal: SMB, magazine, servicii
Best general, multilingv excelent, tooling matur (vision, function calling, structured outputs). Costuri rezonabile pentru volume sub 10k mesaje/lună. Plan Enterprise cu zero data retention și DPA semnat.
OpenAI API + tiktoken + Vercel AI SDK
Ideal: Text românesc lung, documente
Cele mai naturale răspunsuri în română. Context 200k tokens (poți încărca catalog complet sau documentație tehnică completă). Excelent pentru juridic, contabilitate, consultanță unde nuanțele contează.
Anthropic API + Claude Sonnet 4.5 / Opus 4
Ideal: Date sensibile, GDPR strict
Self-hosted pe serverul tău EU sau on-premise. Zero date trimise în cloud. Ideal medical, juridic, financiar, public sector. Necesită server cu GPU (50-300€/lună) dar zero cost per query după.
Ollama / vLLM + Mistral 7B / Llama 3.3 + Qdrant
Antrenare custom (RAG, nu fine-tuning). Indexăm site-ul tău, FAQ-ul, PDF-urile, catalogul, condițiile livrare/retur într-un vector DB (Pinecone, Qdrant sau Postgres pgvector). Chatbot-ul caută bucățile relevante la fiecare întrebare și răspunde cu informația ta — nu inventează. Update document = chatbot știe imediat, fără re-training.
Integrări
Floating bubble bottom-right (sau custom poziționat), branded cu culorile firmei, mobile-friendly. JavaScript pur, fără dependențe — încarcă în <50ms. Compatibil WordPress, Next.js, Shopify, orice site.
Conectare la pagina ta de Business. Răspunde la mesaje DM, comentarii la post-uri (private reply), începe conversații din ad-uri Click-to-Messenger. Handover seamless la echipa ta când e nevoie.
Cu numărul tău de firmă, prin BSP oficial (360dialog, Twilio). Răspunsuri la mesaje, template-uri pentru notificări outbound (status comandă, reminder), butoane interactive. Setup complet inclus.
Bot Telegram cu numele firmei tale, comenzi /start /help /contact configurabile, suport pentru grupuri (community management) și DM. Excelent pentru audiențe tech-savvy și B2B IT.
HubSpot, Pipedrive, Salesforce, SmartBill, NextUp, sau orice sistem cu API REST/GraphQL. Lead-urile calificate ajung direct în CRM cu toate datele structurate. Status comandă citit din ERP.
Răspuns la telefon cu voce AI (ElevenLabs sau OpenAI Realtime), preluare cereri programare, dirijare către consultant uman. Pentru firme cu volum telefonic mare unde recepția e suprasolicitată.
Prețuri
1500€
+ 50€/lună API
livrare 7-10 zile
3500€
+ 100€/lună API
livrare 14-21 zile
8000€+
self-hosted
livrare 30-60 zile
Costul API lunar depinde de volumul real. Cifrele de mai sus sunt medii pentru ~1000-3000 conversații/lună. Dashboard cu cost real-time inclus în toate pachetele.
Process
Zilele 1-2
Sesiune 45-60 min: ce vrei să facă chatbot-ul, pe ce canale, vocea brandului (formal / casual / tehnic), cazuri de escaladare, integrări existente. Apoi colectăm FAQ-ul, prețurile, programele, condițiile livrare/retur, catalogul.
Zilele 3-5
Configurare provider LLM (OpenAI / Anthropic / Llama self-hosted), creare vector DB, procesare și indexare documentele tale (chunking semantic, embeddings), construire system prompt cu personalitatea brandului, primele runs de test cu echipa noastră.
Zilele 6-8
Îți trimitem link de test cu chatbot funcțional. Tu și echipa testați pe scenarii reale (întrebări tipice de la clienți, edge cases, încercări de a-l păcăli). Ajustăm prompt-uri, adăugăm exemple, corectăm răspunsurile imperfecte. 2-3 cicluri de feedback.
Zilele 9-10
Instalare widget pe site (5 minute), conectare Messenger (verificare Meta), setup WhatsApp Business API prin BSP, configurare CRM/calendar/email pentru handover. Sesiune training 1h cu echipa ta. Activare în producție.
Săptămânile 2-4
Primele 30 zile post-live, monitorizăm conversațiile zilnic. Identificăm întrebările la care chatbot-ul n-a știut să răspundă bine, adăugăm răspunsuri în baza de cunoștințe, calibrăm threshold-urile de handover. Raport detaliat la 30 zile cu metrici și recomandări.
De ce noi
Majoritatea „agențiilor AI” din România revând cont OpenAI cu wrapper Tidio sau Voiceflow. Noi construim AI agents folosind aceeași tehnologie pe care o folosesc în propriul meu app open-source ace-step-ui (4.1k stars pe GitHub) și aplicația de pe Mac App Store LocalMusic AI — generator muzică AI rulând local pe Mac M1+ cu framework MLX Apple.
Diferența practică: când îți construim chatbot-ul, știm exact ce înseamnă să optimizezi prompt-uri pentru cost, să faci debug la halucinații, să rulezi modele open-source pe infrastructură proprie, să faci RAG care chiar funcționează (nu doar demo).
Stars GitHub
4.100+
ace-step-ui (open source)
Mac App Store
Live
LocalMusic AI
Stack production
MLX + RAG
Apple Silicon + vector DB
Cod sursă
MIT
Open source verificabil
Întrebări frecvente
Depinde de context. OpenAI GPT-4o / GPT-5: best general, multilingv excelent inclusiv română, cost ~0.005$/1k tokens input. Anthropic Claude Sonnet/Opus: cele mai naturale răspunsuri în RO, context lung 200k tokens (poți încărca documentație voluminoasă). Mistral 7B / Llama 3.3 self-hosted: zero cost per query după setup, datele rămân pe serverul tău (ideal medical, legal, financiar), dar necesită server cu GPU 50-300€/lună. Recomandare default: OpenAI pentru SMB, Claude pentru text românesc lung, Llama local doar dacă regulile GDPR cer datele să nu plece de pe infrastructura ta.
În 3 locuri configurabile. 1) Baza ta de date (Postgres / Supabase / MongoDB) pe serverul tău sau pe un VPS EU — conversațiile, lead-urile, comenzile. 2) Provider LLM (OpenAI / Anthropic) doar pentru a procesa mesajul în timp real — la planul Enterprise sau cu opțiunea „zero retention” bifată, NU se folosesc pentru training și NU se stochează. 3) Vector DB (Pinecone EU, Qdrant self-hosted, sau Postgres pgvector) pentru baza de cunoștințe a chatbot-ului. Pentru cazuri sensibile (medical, juridic), recomandăm setup 100% self-hosted: Llama + Qdrant + Postgres pe serverul tău, datele nu pleacă nicăieri.
Nu, e RAG (Retrieval-Augmented Generation), nu fine-tuning clasic. În practică: 1) Ne dai sursele tale — site, PDF-uri, FAQ existent, catalog produse, prețuri, programe, condiții livrare/retur. 2) Le procesăm și le indexăm într-un vector DB (chunks semantice). 3) La fiecare întrebare, chatbot-ul caută bucățile relevante și le folosește ca context pentru răspuns. Avantaj: dacă mâine schimbi un preț sau adaugi un produs nou, actualizezi documentul — chatbot-ul „știe” imediat fără re-training. Setup inițial: 3-7 zile. Update-uri ulterioare: minute.
Cifre reale, nu marketing. 1000 conversații (medie 6 mesaje/conversație, ~300 tokens/mesaj): OpenAI GPT-4o-mini ~8-15€/lună, GPT-4o ~25-50€/lună. Claude Haiku ~10-20€/lună, Sonnet ~30-60€/lună. Llama self-hosted: ~50€/lună server (indiferent de volum). Pentru cazuri reale: magazin online cu ~3000 conversații/lună plătește 40-80€/lună API. Restaurantul cu 500 rezervări/lună plătește sub 15€/lună. Includem dashboard cu cost real-time și rate-limits pe user să nu „explodeze” factura dacă cineva spam-uiește.
Funcționează cu numărul tău de firmă, dar trecut prin WhatsApp Business API oficial (nu WhatsApp normal sau Business app). Pași: 1) Cont Meta Business verificat (1-3 zile dacă firma e nouă). 2) Numărul trecut la WhatsApp Business API printr-un BSP — recomandăm 360dialog (~50€/lună) sau Twilio (pay-per-message). 3) Conectare la chatbot-ul nostru via webhook. Costul mesajelor: Meta percepe 0.04-0.07€ per conversație 24h (gratuite dacă utilizatorul scrie primul). Pentru România, volum mediu ~30-80€/lună mesaje + 50€ BSP. Tot procesul de setup îl gestionăm noi, inclusiv documentele de la Meta.
Trei mecanisme combinate. 1) Detecție automată: dacă chatbot-ul nu găsește răspuns cu confidence mare în baza ta de cunoștințe sau detectează frustrare („vorbesc cu un om!”, mesaje în caps, repetiție întrebare), transferă conversația. 2) Buton vizibil „Vorbește cu un consultant” mereu prezent, fără să trebuiască 3 mesaje. 3) Programare automată: dacă oamenii tăi nu sunt online (în afara orarului), chatbot-ul colectează contact + cerere și programează callback. Transferul se face în interfața ta preferată: Slack, email, WhatsApp grup intern, sau direct în CRM (HubSpot, Pipedrive). Conversația anterioară e transmisă completă agentului uman — nu reia clientul de la zero.
Da, cu condiții. 1) Notificare clară la începutul conversației: „Chatbot AI, conversațiile sunt procesate și stocate pentru îmbunătățire serviciu. Vezi politica de confidențialitate.” cu link. 2) Update politica ta de confidențialitate să menționeze procesarea AI și sub-procesorii (OpenAI / Anthropic). 3) DPA (Data Processing Agreement) semnat cu provider LLM — OpenAI și Anthropic oferă la cerere, fără cost suplimentar. 4) Drept la ștergere implementat (utilizatorul poate cere ștergerea conversațiilor lui). 5) Pentru date super-sensibile (medicale, juridice, financiare) — Llama self-hosted pe server EU, fără cloud LLM. Livrăm template DPA, modificările la politica de confidențialitate și DPIA scrisă pentru proiecte cu date sensibile.
Pachetul Starter: 7-10 zile calendaristice. Pachetul Pro: 14-21 zile. Custom: 30-60 zile. Defalcare Starter: ziua 1-2 brief și colectare conținut (FAQ, prețuri, condiții livrare), ziua 3-5 setup infrastructură + indexare baza cunoștințe + tuning prompt, ziua 6-8 testare împreună cu tine pe scenarii reale și ajustări, ziua 9-10 integrare pe site + dashboard + training echipa ta (1h video call). Imediat după go-live, monitorizăm 7 zile activ și corectăm răspunsurile imperfecte. La 30 zile facem un review cu metrici (conversii, întrebări la care n-a știut să răspundă, satisfacție).