Interesant

Rețele contradictorii generative: tehnologia din spatele DeepFake și FaceApp

Rețele contradictorii generative: tehnologia din spatele DeepFake și FaceApp

Rețelele contradictorii generative sau GAN-urile au fost discutate din ce în ce mai mult în ultimii ani. Dacă vă întoarceți cu 10 ani în urmă, nu veți găsi nicio urmă a unui astfel de subiect. Deci, ce a făcut ca Rețelele Adversare Generative să ajungă în prim plan și de ce ar trebui să vă pese? Sa discutam.

Ori de câte ori există o discuție despre Rețelele Adversare Generative sau GAN-uri, aceasta este întotdeauna în contextul IA, învățare automată sau învățare profundă. Deși acest subiect este destul de vast, acest articol este menit să vă ajute să îl înțelegeți în termeni simplificați.

Să începem cu termenul însuși - Rețele contradictorii generative.

ÎN LEGĂTURĂ: ACEST NOU SISTEM AI POT VEDEA CE GÂNDIȚI

GAN-urile reprezintă fundamental o abordare a modelării generative folosind metode de învățare profundă. Cuvântul „Generativ” din termen indică proprietatea GAN-urilor de a crea ceva propriu.

Cum poate un program să aibă creativitatea de a crea ceva propriu? Îi oferim puterea învățării automate, unde poate învăța din datele anterioare.

Deci, dacă ați hrăni GAN-urile cu o tonă de imagini, acesta poate crea o imagine unică proprie. Același lucru este valabil pentru orice set de date.

Având în vedere această definiție, ne confruntăm cu o problemă în care nu există niciun filtru care să verifice ieșirea generatorului pentru autenticitate. Generatorul poate crea orice este legat de setul său de date de referință fără să știe unde ar fi acceptabil pentru noi sau nu.

Pentru a rezolva această problemă, GAN-urile vin cu o rețea discriminativă care verifică datele generate cu datele adevărate. Aceasta este partea Adversarial a unei rețele Adversarial Generative. În esență, ne confruntăm cu rețeaua generativă și cu cea discriminativă, creându-ne adversari.

Rețeaua discriminativă sau un discriminator este utilizat pentru a menține valorile generate ale generatorului sub control. Și sarcina generatorului este de a păcăli discriminatorul în a crede că valorile generate sunt de fapt reale și nu generate de computer.

Acesta este conceptul de bază al GAN-urilor.

GAN-urile sunt explicate mai detaliat în lucrare de Ian Goodfellow și alți cercetători de la Universitatea din Montreal, intitulată în mod adecvat Generative Adversarial Networks.

În lucrare, au menționat în mod clar că întregul scop al rețelei generative este de a împinge rețeaua discriminativă să facă o greșeală. Și rețeaua discriminativă va face o greșeală numai atunci când nu poate face diferența între datele generate de mașină și datele de instruire.

Cel mai bun mod de a instrui un GAN este prin utilizarea bazei de date MNIST (baza de date modificată a Institutului Național de Standarde și Tehnologie).

Baza de date constă dintr-un set de instruire de 60.000 de exemple și un set de testare de 10.000 de exemple. MNIST Training folosește valori numerice scrise de mână.

Sunt un început minunat pentru oricine caută resurse pentru a forma rețele. Este un set de date care a fost folosit pentru instruirea modelului de către Ian și echipa sa.

Din aceste date, cea mai bună analogie pe care o putem folosi pentru GAN este că este un joc cu doi jucători în care fiecare jucător încearcă din răsputeri să se învingă unul pe celălalt.

S-ar putea să vă amintiți încă valul de știri care a venit la sfârșitul lunii decembrie 2018 despre imagini cu aspect realist generate de o IA. Ei bine, asta a fost GAN!

Dacă examinați aceste imagini, este ușor să vedeți de ce a fost o poveste atât de mare. Imaginile nu se deosebeau de imaginile din viața reală ale unui chip uman.

Persoanele din spatele proiectului erau NVidia, popularul dezvoltator de hardware și software pentru grafică pe computer. Cercetătorii din spatele proiectului au pregătit o lucrare cu privire la dezvoltarea acestuia și rezultatele lor, intitulată O arhitectură generatoare bazată pe stil pentru rețele contradictorii generative.

Cercetătorii de la NVidia au petrecut 8 săptămâni antrenând rețelele, iar acest lucru a folosit opt ​​din gama lor de plăci grafice Tesla.

Acest lucru ridică cu siguranță câteva întrebări cu privire la modul în care mai putem avea încredere în datele picturale. De asemenea, dacă suntem capabili să creăm fețe umane din imagini de referință, nu va trece mult până când vom putea crea fețe perfecte, provocând că modelele vor rămâne fără serviciu!

Mulți își exprimă îngrijorarea cu privire la utilizarea datelor picturale în sistemul judiciar dacă software-ul poate modifica imaginile atât de eficient. Acesta este cu siguranță ceva la care să ne gândim!

Revenind la subiectul cât de departe este dezvoltarea GAN, nimic nu descrie o imagine mai clară a tehnologiei decât experimentul de la NVidia. Suntem capabili să creăm fețe cu aspect realist, care nu sunt doar credibile, ci foarte personalizabile de către computer.

Cercetările sunt încă în desfășurare pentru a face GAN-urile mai puternice pentru a crea date realiste și cu cerințe mai puține.

GAN-urile pot fi utilizate într-o varietate de aplicații, în principal legate de imagini, dar acest lucru se va schimba cu siguranță. În prezent, GAN-urile sunt utilizate în:

Generarea de conținut nou (imagini): GAN-urile pot fi utilizate pentru a crea imagini realiste dintr-un set de imagini sursă. Utilizarea unui astfel de sistem este doar pentru a înțelege capacitățile GAN-urilor.

Unii susțin că această tehnologie poate fi utilizată pentru a determina aspectul unui bebeluș din fotografiile părinților săi.

Îmbătrânirea sau dez-îmbătrânirea: Cu un set robust de imagini eșantion, GAN-urile pot îmbătrâni sau elimina cu succes fețele umane. Popularitatea recentă a unei aplicații numite FaceApp arată cum o astfel de tehnologie este foarte populară în rândul maselor.

Dacă vă întrebați despre tehnologia din spatele FaceApp, GAN-urile sale.

Colorarea fotografiilor alb-negru: Când un GAN este instruit suficient de bine, poate colora fotografiile și o poate face remarcabil de bine. Această tehnologie poate într-adevăr să dea viață fotografiilor vechi și să ne ofere o privire asupra acelei perioade în culori.

Îmbunătățirea rezoluției: Dacă ați încercat să îmbunătățiți rezoluția unui rezultat scăzut într-o imagine, rezultatul este întotdeauna o mizerie neclară cu pixeli aruncați. Cu toate acestea, GAN înlocuiește fiecare imagine suplimentară și creează imagini de îmbunătățire de înaltă calitate chiar și atunci când rezoluția lor este scăzută.

Lumea a văzut multe exemple de GAN-uri la lucru, iar cercetările în curs în această direcție indică multe alte aplicații neașteptate ale GAN-urilor în viitor.

ÎN LEGĂTURĂ: CONTINUAȚI SĂ ACȚIONAȚI ÎN MODURI IMPREDICABILE, Oare ar trebui să ne panicăm?

Tehnologia este revoluționară și ne putem aștepta ca GAN-urile să apară pe dispozitivele noastre în mai multe moduri. Cu toate acestea, înainte ca această tehnologie să se maturizeze, sunt necesare discuții serioase cu privire la utilizarea etică a unor astfel de metode puternice de învățare profundă.


Priveste filmarea: Robert Downey Jr and Tom Holland in Back to the future - This is heavy! deepfake (Septembrie 2021).