Cine sunt cei care ne ascultă discuţiile prin smartphone-uri. Sunt plătiţi cu 12 dolari pe oră şi notează fiecare cuvânt pe laptopurile lor

Autor: Bogdan Cojocaru Postat la 24 ianuarie 2020 115633 afişări

Cine sunt cei care ne ascultă discuţiile prin smartphone-uri. Sunt plătiţi cu 12 dolari pe oră şi notează fiecare cuvânt pe laptopurile lor

Alexa, Siri, Cortana sunt câteva dintre numele care ştiu poate mai multe despre noi decât cei mai apropiaţi prieteni ai noştri. Cum au ajuns giganţii din Silicon Valley să ne cunoască cele mai ascunse secrete?

Lui Ruthy Hope Slatis nu-i venea să creadă ceea ce auzea. Era angajată temporar printr-o agenţie de recrutare din afara Bostonului pentru un post cu o descriere vagă: transcrierea de fişiere audio pentru Amazon.com. Pentru 12 dolari pe oră, ea şi colegii săi aduşi prin contract sau „asociaţi de date” ascultau fragmente de conversaţii aleatorii şi notau fiecare cuvânt pe laptopurile lor. Amazon ar spune că munca a fost esenţială pentru un produs top secret de recunoaştere a vorbirii. Fişierele includeau înregistrări cu momentele cele mai intime din casele oamenilor, scrie Bloomberg.

Acestea se întâmplau în toamna anului 2014, când Amazon a dezvăluit boxa portabilă Echo animată de asistentul virtual activat prin voce Alexa. Amazon spune despre Alexa că este un miracol al inteligenţei artificiale în prima sa reclamă pentru Echo – în clip o familie solicita şi primea actualizări de ştiri, răspunsuri la întrebări banale şi ajutor la temele copiilor. Însă Slatis a început curând să înţeleagă măsura în care oamenii se aflau în spatele magiei robotice pe care o vedea în reclamă. „O, Dumnezeule, la asta lucrez”, îşi aminteşte ea ce gândea atunci. Amazon surprindea fiecare comandă vocală din cloud şi se baza pe analişti de date ca ea pentru a învăţa sistemul. Slatis credea la început că asculta testeri plătiţi care şi-au oferit modelele vocale în schimbul câtorva dolari. Şi-a dat seama că nu este deloc aşa.

Înregistrările pe care le asculta împreună cu colegii ei erau deseori intense, ciudate sau foarte ciudate. Oameni ce păreau singuri îşi mărturiseau secretele şi temerile intime: un băiat şi-a exprimat dorinţa de a viola; erau bărbaţi care o tratau pe Alexa ca Joaquin Phoenix în filmul SF „Her”. Şi cum programul de transcriere a crescut odată cu popularitatea Alexei, la fel creşteau şi informaţiile private dezvăluite în înregistrări. Alţi asociaţi de date îşi amintesc de copii care îşi împărtăşeau adresa de domiciliu şi numărul de telefon, de un bărbat care încerca să comande jucării sexuale, de un invitat la o petrecere care se întreba cu voce tare dacă nu cumva Amazon se uita la ei chiar în acel moment. „N-aveau cum să fi ştiut că sunt ascultaţi”, spune Slatis. „Aceşti oameni nu au fost de acord cu acest lucru.” Ea a renunţat în 2016. La cinci ani de când Slatis a simţit pentru prima că i se face pielea de găină, un sfert dintre americani au „boxe inteligente” precum Echo, Google Home şi Apple HomePod. (Sunt câţiva care au cumpărat chiar şi Portalul Facebook, un ecran video inteligent.) Amazon câştigă până acum bătălia vânzărilor, raportând că au fost achiziţionate peste 100 de milioane de dispozitive animate de Alexa.

Însă acum, între cele mai mari companii din lume se duce un război pentru a o aduce pe Alexa, pe Siri al Apple, pe asistentul Google, pe Cortana a Microsoft şi pe serviciul echivalent al Facebook mult mai adânc în vieţile oamenilor. Microfoanele sunt încorporate în telefoane, ceasuri inteligente, televizoare, frigidere, SUV-uri şi mai tot ce înseamnă dispozitiv inteligent. Firma de consultanţă Juniper Research estimează că până în 2023 piaţa mondială a boxelor inteligente va ajunge la 11 miliarde de dolari pe an şi că vor exista aproximativ

7,4 miliarde de dispozitive controlate prin voce. Este vorba despre un dispozitiv pentru fiecare persoană de pe Pământ.

Aceste maşini nu creează fişiere audio din fiecare decibel al tău – companiile tehnologice spun că difuzoarele lor inteligente înregistrează audio doar atunci când utilizatorii le activează, dar introduc microfoane active în permanenţă în bucătării şi dormitoare care ar putea să surprindă sunete pe care utilizatorii nu intenţionează să le împartă cu nimeni. „Microfoanele care ascultă tot timpul sunt ceva îngrijorător. Am descoperit că utilizatorii acestor dispozitive închid ochii şi au încredere că companiile nu vor face nimic rău cu datele înregistrate ”, spune Florian Schaub, profesor de la Universitatea din Michigan, care studiază comportamentul uman în jurul software-ului de comandă vocală. „Există această eroziune înfiorătoare a vieţii private care continuă fără întrerupere. Oamenii nu ştiu să se protejeze.”

Cu toate acestea, aşa-numitele dispozitive inteligente depind de mii de oameni slab plătiţi care strâng fragmente de sunet cu ajutorul cărora companiile de tehnologice îşi îmbunătăţesc urechile electronice; şoaptele noastre cele mai uşoare au devenit unele dintre cele mai valoroase seturi de date ale giganţilor din Silicon Valley. La începutul acestui an, Bloomberg News a scris în premieră despre amploarea utilizării de către industria de tehnologie a oamenilor pentru a asculta sunetele colectate de la utilizatorii lor fără permisiune.Actuali şi foşti asociaţi de date ca Slatis arată clar că dezavantajele supravegherii audio generale erau evidente pentru cei cu mize financiare mai mici în joc. „Nu s-a simţit niciodată ca fiind ceva corect”, spune un transcriptor pentru un rival al Alexa, care, la fel ca majoritatea asociaţilor de date, a semnat un acord care-i interzice să vorbească despre munca sa. „Ce vând ei cu adevărat clienţilor?”

Pentru procesul de învăţare a maşinilor să identifice şi să răspundă la propoziţii vorbite a fost de cele mai multe ori nevoie de potrivirea fişierelor audio cu textul transcris. Este un proces lent şi scump. Primii pionieri au cumpărat sau au construit biblioteci masive de înregistrări – oameni care citesc ziare sau alte materiale pre-scrise la microfon. Apple a devenit prima companie majoră care a schimbat modelul când în 2011 a livrat iPhone 4S cu Siri, achiziţionat cu un an înainte de la un centru de cercetare finanţat de Pentagon. Nu mai era nevoie ca înregistrările să fie scrise şi potrivite în laboratoare. Apple a vândut peste 4 milioane de telefoane 4S în câteva zile şi în curând a început să acumuleze un munte de date vocale gratuite şi naturale. În primii ani, compania a avut încredere în specialiştii în software vocal pentru a utiliza datele cu scopul de a îmbunătăţi abilităţile lui Siri, însă Apple a revenit la control în jurul anului 2014. „Munca era foarte migăloasă: după ce ascultai 15 sau 30 de minute, căpătai dureri de cap”, spune Tao Ma, fost specialist de vorbire la Siri. Echipa de la Apple a cedat o mare parte a acestei munci firmelor de outsourcing din Europa, inclusiv GlobeTech, din Irlanda.

În ultimii ani, Apple a devenit mai agresivă în procesul de culegere şi analiză a vocilor oamenilor, fiind îngrijorată de faptul că puterea de a înţelege şi viteza lui Siri au rămas în urma celor ale Alexa şi Google Assistant. Apple a tratat dezvoltarea lui Siri ca pe un motor de căutare verbală pe care trebuia să-l pregătească pentru a răspunde întrebărilor interminabile ale utilizatorilor şi şi-a crescut dependenţa de analiza audio pentru a alimenta lexiconul asistentului.

Foşti colaboratori descriu sistemul ca pe un Turn Babel sau ceva din distopia 1984 a lui George Orwell. Unii povestesc cum la un birou al GlobeTech de lângă aeroportul din Cork, Irlanda stăteau în tăcere la MacBookuri, purtând căşti, cu misiunea de a transcrie 1.300 de înregistrări pe zi, fiecare dintre ele putând fi o singură propoziţie sau o întreagă conversaţie. (Această cotă a fost redusă de la 2.500 de înregistrări, spun alţii, pentru a îmbunătăţi ratele de acurateţe.) Când un asociat de date făcea clic pe butonul de redare pentru a asculta o înregistrare vocală, computerul umplea o casetă de text cu cuvintele despre care credea că Siri „le-a auzit”, apoi solicita angajatului să aprobe sau să corecteze transcrierea şi să meargă mai departe.

Un program pe care colaboratorii l-au folosit, numit CrowdCollect, includea butoane care le permiteau să treacă peste înregistrări din mai multe motive – declanşarea accidentală, lipsa audio, limbajul indecent –, însă, spun ei, nu a existat un mecanism specific pentru a raporta sau a şterge un fişier audio jignitor inadecvat, cum ar fi cererile unor utilizatori care par beţi sau oameni care dictează mesaje deocheate. Colaboratorilor care şi-au întrebat managerii dacă pot sări peste înregistrări prea intime li s-a spus că nicio înregistrare nu este prea intimă.

Asociaţii de date rezistau adesea doar câteva luni, iar instruirea în problemele de confidenţialitate a fost minimă. Un fost colaborator care nu avea nicio calificare cu privire la munca sa spune că ascultarea utilizatorilor din lumea reală a fost ceva „absolut hilar”.  

În 2015, acelaşi an în care directorul executiv al Apple, Tim Cook, a descris confidenţialitatea ca fiind un „drept fundamental al omului”, maşinăriile Apple prelucrau mai mult de un miliard de cereri pe săptămână. Până atunci se ajunsese ca utilizatorii să poată activa o aplicaţie a programului de operare astfel încât nu mai trebuiască să apese un buton pe iPhone pentru a activa asistentul vocal; acesta asculta mereu. În acordul de utilizare, spune Apple, se prevede că datele vocale pot fi înregistrate şi analizate pentru a îmbunătăţi Siri, dar nicăieri nu este menţionat că oamenii ar putea asculta. „M-am simţit jenat ascultând alţi oameni”, spune unul dintre foştii colaboratori, mai ales având în vedere cât de dese erau înregistrările copiilor.

Zece foşti directori ai Apple din divizia Siri spun că nu au văzut şi încă nu văd acest sistem ca fiind o încălcare a vieţii private. Aceşti foşti directori spun că înregistrările au fost dezasociate de ID-urile de utilizator Apple şi au presupus că utilizatorii au înţeles că compania le prelucrează înregistrările audio, deci ce mai conta dacă oamenii au ajutat la procesare?

Foşti şi actuali colaboratori spun că cele mai multe solicitări pentru Siri sunt banale – „cântă o melodie a lui Justin Bieber”, „unde este cel mai apropiat McDonald's”, dar îşi amintesc că au dat şi peste mesaje extrem de grafice, cu conţinut rasist sau homofob. Un fost analist de date care a lucrat la transcrieri de la Siri spune că angajaţii din Cork făceau schimb de poveşti de groază în timpul pauzelor de ţigară. Un actual analist, rugat să povestească cea mai scandaloasă înregistrare care a venit prin CrowdCollect, spune că era ceva asemănător cu o scenă din Fifty Shades of Grey.

Apple susţine că mai puţin de 0,2% din solicitările pentru Siri sunt supuse analizei umane, iar foştii manageri resping mărturiile contractanţilor ca fiind exagerări. „Oh, am auzit pe cineva care face sex sau aşa altceva. Dar auzi şi oameni care emit gaze sau strănută. Există tot felul de zgomote acolo când porniţi un microfon“, spune Tom Gruber, cofondator al Siri. „Nu este ca şi cum dispozitivul ar avea ca scop înregistrarea oamenilor care scot anumite tipuri de sunete. Este ca o întâmplare.”

Până în 2019, după ce Apple a pus Siri pe produse precum căştile sale fără fir şi boxa HomePod, numărul de comenzi vocale procesate a ajuns la 15 miliarde; 0,2% din 15 miliarde reprezintă 30 milioane de „întâmplări” pe lună, sau 360 milioane pe an. 

Urmărește Business Magazin

Preluarea fără cost a materialelor de presă (text, foto si/sau video), purtătoare de drepturi de proprietate intelectuală, este aprobată de către www.bmag.ro doar în limita a 250 de semne. Spaţiile şi URL-ul/hyperlink-ul nu sunt luate în considerare în numerotarea semnelor. Preluarea de informaţii poate fi făcută numai în acord cu termenii agreaţi şi menţionaţi in această pagină.