Imaginile de produs pot face diferența între o vânzare reușită și trafic care nu se materializează în nimic. Dar ce se întâmplă atunci când acestea lipsesc? Cu ajutorul tehnologiei AI, aplicația Eeatingh vine acum cu o soluție inovatoare: generarea automată de imagini stilizate pentru produse, transformând datele simple, deja disponibile, în vizualuri atrăgătoare care sporesc atractivitatea oricărui meniu. Hai să vedem împreună cum, în următorul studiu de caz.
Provocarea lipsei imaginilor de produs
Imaginea este cel mai adesea primul lucru care captează atenția unui potențial client. Cu atât mai adevărat în aplicațiile pentru restaurante, unde utilizatorii iau decizii bazate, în mare parte, pe aspectul vizual al preparatelor. Imaginile de calitate joacă un rol esențial în crearea unei experiențe atractive și convingătoare pentru utilizatori, influențând direct vânzările. În lipsa lor, produsele par incomplete, mai puțin apetisante, ceea ce poate reduce considerabil șansele ca acestea să fie comandate.
Din păcate, multe restaurante se confruntă cu dificultăți în a oferi imagini pentru toate produsele din meniu. Principalele motive sunt lipsa resursele pentru a realiza sesiuni foto profesionale sau incapacitatea de a actualiza rapid imaginile în funcție de schimbările din meniu. Lipsa acestor imagini nu doar că afectează experiența utilizatorilor, dar poate crea și o impresie de neglijență sau lipsă de profesionalism din partea restaurantului.
Fă cunoștință cu clientul – platforma Eeatingh
Eeatingh este o platformă online locală care livrează mâncarea preferată direct la ușa clienților încă din 2014. În cei 10 ani de existență, Eeatingh a concurat cu succes pe piața locală cu jucători mari precum Food Panda, Glovo și Tazz, menținându-și poziția printr-un model de business agil și flexibil. În ciuda prezenței acestor giganți, Eeatingh a prosperat oferind un serviciu de livrare la domiciliu digitalizat, fără costuri suplimentare pentru clientul final, permițând utilizatorilor să savureze mese delicioase fără a părăsi confortul casei.
Soluția noastră: generarea automată de imagini AI
Pentru a rezolva problema lipsei de imagini de produs, am dezvoltat o soluție inovatoare care folosește inteligența artificială pentru a genera automat imagini stilizate, bazate pe datele produselor din aplicația Eeatingh. Prin intermediul unui API construit în Python, aplicația noastră utilizează acum un model AI generativ text-imagine, care transformă informațiile simple ale produsului (cum ar fi numele și descrierea) în imagini atractive, într-un stil desenat sau vectorial.
Cireașa de pe tort: procesul nu necesită o intervenție manuală pentru a crea prompturi detaliate, deoarece API-ul preia automat datele produsului și le trimite către modelul AI. Astfel, restaurantele care nu au imagini pentru preparatele lor pot beneficia de o soluție rapidă și eficientă, integrată direct în platforma Eeatingh, fără nicio oră de training de redactare a prompt-urilor. În schimb, totul e rezolvat dintr-un click: în cadrul secțiunii de administrare, există un nou buton care permite generarea automată a imaginilor, oferind o alternativă practică la încărcarea manuală a fotografiilor.
Tehnologia din spatele acestei soluții include Google Cloud - Vertex AI și integrarea cu modelul de generare de imagini Imagen 3. Acest model utilizează un pas intermediar cu un model de limbaj mare (LLM), care extinde numele scurte ale produselor în descrieri detaliate, incluzând informații relevante precum ingredientele, modul de preparare sau sugestii de servire. Această expansiune a datelor îmbunătățește semnificativ calitatea imaginilor generate.
Ca paranteză, merită menționat că Imagen 3 a fost lansat de curând, în august 2024, iar Reea a fost invitată ca partener la testarea acestei tehnologii, oferind feedback și primind de la inginerii Google sugestii și modele de bună practică în folosirea ei.
Prin intermediul acestei tehnologii, restaurantele nu doar că economisesc timp și resurse, dar pot, de asemenea, să ofere utilizatorilor o experiență vizuală îmbunătățită, contribuind astfel la creșterea atractivității și a ratei de conversie a produselor.
Cum funcționează API-ul de generare a imaginilor
Procesul începe cu transmiterea datelor despre produs – numele și descrierea acestuia – către API. Aceste date sunt apoi prelucrate de un model de limbaj mare (LLM), care extinde și îmbogățește informațiile inițiale. De exemplu, un nume simplu de produs, cum ar fi „pizza margherita”, poate fi transformat într-o descriere detaliată ce include informații despre ingrediente (brânză mozzarella, sos de roșii etc.), metoda de preparare (coaptă pe vatră) și stilul de servire (cu busuioc proaspăt). Acest pas este esențial pentru generarea unor imagini cât mai realiste și relevante.
Odată ce descrierea a fost generată și optimizată, API-ul trimite aceste date către modelul Imagen 3, care creează imaginea produsului. Imagen 3 este cunoscut pentru capacitatea sa de a genera imagini de înaltă calitate cu un nivel ridicat de detaliu și realism, fiind optimizat pentru a oferi rezultate rapide și precise.
API-ul nostru poate fi utilizat de mai multe aplicații sau site-uri web, fiind conceput să fie flexibil și ușor de integrat. Costurile asociate sunt reduse datorită utilizării serviciilor cloud și ale optimizărilor implementate, iar pentru un volum mare de imagini, prețul per imagine poate scădea considerabil, făcând această soluție accesibilă pentru afaceri de toate dimensiunile.
Tot acest proces de generare a imaginilor se desfășoară în fundal, fără a necesita intervenția utilizatorilor din secțiunea de administrare a aplicației Eeatingh. Astfel, atunci când un produs nu are o imagine încărcată, se poate genera automat o imagine nouă printr-un simplu click, oferind astfel o soluție rapidă și eficientă pentru completarea meniurilor vizuale ale restaurantelor.
Provocările întâmpinate și soluțiile găsite
Deși generarea automată de imagini AI aduce beneficii semnificative, procesul de dezvoltare și integrare a tehnologiei n-a fost lipsită de provocări. Uite pe cele mai mari:
1. Provocarea numelor scurte sau tradiționale de produse
Una dintre principalele dificultăți întâmpinate a fost legată de produsele cu denumiri scurte sau foarte generice, cum ar fi „pizza” sau „paste”. Aceste denumiri simple nu oferă suficient context pentru a genera o imagine clară și detaliată, ceea ce ducea la imagini de calitate medie sau irelevante. O altă problemă a apărut în cazul preparatelor tradiționale, cu nume regionale, cum ar fi „tochitură” sau „mămăligă”, care nu se traduceau eficient sau nu erau recunoscute corect de modelele AI.
Soluția: Am implementat un model de limbaj mare (LLM) care extinde și îmbogățește denumirile scurte prin generarea automată a unor descrieri detaliate. Acest proces de expansiune a denumirilor include ingrediente specifice, metode de preparare și sugestii de servire, oferind modelului AI suficiente informații pentru a genera imagini mai precise și relevante. De asemenea, pentru produsele tradiționale, s-au adăugat mecanisme de îmbunătățire a prompturilor, care pot include descrieri culturale sau exemple de preparate similare din alte culturi.
2. Text pe imagini generate
Ocazional, unele imagini generate conțineau text suprapus, ceea ce nu era dorit, mai ales în contextul imaginilor de meniu pentru restaurante. Trebuie spus că aceasta este o problemă specifică întâlnită în modelele generative care sunt antrenate pe date ce includ și elemente textuale.
Soluția: Am adăugat un filtru de control al calității imaginilor generate, care detectează și elimină imaginile cu suprapuneri textuale. De asemenea, utilizatorii au la dispoziție un mecanism de feedback, prin care pot marca imaginile necorespunzătoare, ajutând astfel la îmbunătățirea continuă a procesului de generare și filtrare.
3. Gestionarea imaginilor pentru produse cu nume foarte similare
În unele cazuri, produsele cu denumiri foarte similare (cum ar fi „pizza margherita” și „pizza quattro formaggi”) duceau la generarea unor imagini aproape identice, chiar dacă produsele respective au diferențe vizuale semnificative.
Soluția: Am implementat un algoritm care ia în calcul diferențele cheie între produse în momentul extinderii descrierilor textuale, asigurându-se că modelul AI generează imagini distincte și relevante pentru fiecare produs. Prin includerea unor detalii precum tipurile specifice de brânză sau modul diferit de preparare, am reușit să diversificăm imaginile generate chiar și pentru produse similare.
4. Costuri și performanță în timp real
Generarea de imagini AI poate fi costisitoare, mai ales pentru volume mari de produse. De asemenea, viteza de generare a imaginilor este esențială, deoarece restaurantele trebuie să poată adăuga rapid noi preparate în meniuri, fără întârzieri semnificative.
Soluția: Am optat pentru integrarea cu Google Cloud și modelul Imagen 3, care oferă un echilibru optim între calitate și viteză. Imagen 3 Fast permite generarea de imagini în mai puțin de 5 secunde pentru un set de 4 imagini, ceea ce este ideal pentru nevoile restaurantelor. În plus, utilizarea serviciilor cloud ne permite să menținem costurile sub control, asigurând un preț competitiv per imagine generată, cu reducerea costurilor pe măsură ce volumul crește.
Prin rezolvarea acestor provocări, am reușit să optimizăm procesul de generare a imaginilor și să oferim o soluție eficientă, scalabilă și accesibilă pentru restaurantele care utilizează aplicația Eeatingh.
Cazuri de utilizare și potențialul pe termen lung
Tehnologia de generare automată de imagini AI pe care am implementat-o în aplicația Eeatingh oferă evidentele avantaje imediate, dar adevăratul său potențial este cu mult mai mare. Uite câteva exemple:
1. E-commerce și retail
Un domeniu cu un potențial imens este e-commerce-ul. Magazinele online, în special cele cu un inventar mare de produse, se confruntă adesea cu dificultăți în a prezenta imagini de calitate pentru fiecare articol din stoc. Soluția de generare automată a imaginilor AI poate fi utilizată pentru a crea rapid imagini atractive pentru produsele care nu au fotografii disponibile. Fie că este vorba despre articole de modă, tehnologie sau chiar produse artizanale, această tehnologie poate transforma descrierile textuale în imagini vizuale care să atragă clienții.
2. Industria hotelieră și turism
Industria hotelieră și cea de turism pot, de asemenea, să valorifice generarea automată de imagini AI. Hotelurile pot crea imagini pentru camere, facilități sau pachete speciale de servicii pe baza descrierilor acestora. De asemenea, agențiile de turism pot genera imagini pentru diferite pachete de vacanță sau destinații care nu dispun de fotografii reale sau actualizate, oferind o reprezentare vizuală care să atragă turiștii.
3. Educație și formare online
Platformele de educație online și de formare pot folosi această tehnologie pentru a crea imagini vizuale atractive pentru cursuri, tutoriale sau materiale educative care nu au imagini în mod implicit. De exemplu, un curs despre gătit poate utiliza imagini generate AI pentru fiecare rețetă sau ingredient, oferind cursanților o experiență de învățare mai captivantă.
Potențialul pe termen lung
Pe termen lung, tehnologia de generare a imaginilor AI poate deveni un instrument standard pentru orice afacere care se bazează pe prezentarea vizuală a produselor. Evoluțiile continue în modelele AI, cum ar fi cele oferite de Google Cloud – Imagen 3, vor permite generarea de imagini din ce în ce mai realiste și detaliate, cu costuri reduse și viteze mai mari. De asemenea, integrarea cu platforme precum cele de social media sau marketplace-uri va permite generarea automată de imagini pentru postări, reclame și pagini de produse, eliminând nevoia de resurse vizuale externe.
De altfel, la Reea deja am experimentat și alte tooluri, inclusiv în proiecte comerciale în care ne-am folosit de modele AI, cum ar fi DallE, Midjourney și Stable Diffusion 3, în design de logo-uri, conținut de marketing, postări pentru social media etc. demonstrând deja potențialul acestor tehnologii în multiple domenii.
Astfel, de la restaurante și magazine online, la hoteluri și platforme educaționale, generarea automată de imagini AI va continua să își extindă aplicabilitatea, devenind o parte integrantă din strategiile de marketing și vânzări ale multor industrii.