Prof. Phillip C. Nell, WU Executive Academy, Viena: „Capcana simplificării - Modul în care neglijarea factorului de incertitudine în interpretarea datelor poate conduce la greşeli costisitoare"

Postat la 19 februarie 2019 99 afişări

În ziua de azi, firmele îşi bazează din ce în ce mai mult deciziile pe analiza de date. Acest trend se aplică, de asemenea, şi domeniilor sau funcţiilor care, în mod tradiţional, sunt mai puţin „cantitative”, precum resursele umane.

Domeniul HR a început să recupereze rapid teren, astfel încât în prezent există un număr mare de aplicaţii de prelucrare a datelor, iar firmele experimentează din ce în ce mai mult cu recruiteri roboţi (prin mesageria Facebook) sau cu scanarea „automatizată” a profilurilor de candidaţi. Cu toate acestea, am constatat adesea că mulţi dintre oamenii de HR au anumite lacune în ceea ce priveşte principiile de bază ale cercetării cantitative. Una dintre acestea priveşte modul în care se gestionează factorul de incertitudine a datelor colectate, în acest domeniu al resurselor umane. De pildă, managerii operează deseori cu date obţinute de la un anumit eşantion şi nu de la populaţie în întregul ei, dar le tratează ca şi cum ar fi reprezentative pentru toată populaţia. A trece cu vederea acest detaliu poate să conducă la decizii eronate şi la greşeli costisitoare.

Incertitudinea eşantioanelor:

De obicei, managerii departamentelor de HR sunt interesaţi să aibă date despre întreaga lor organizaţie, despre toate echipele de proiect ale firmei, despre angajaţi, expaţi etc. Totuşi, oricât am vrea să obţinem toate aceste date, colectarea lor poate fi extrem de costisitoare, atât ca bani, cât şi ca timp. Aşadar, pentru a evita acest lucru, managerilor de HR le este cerută adesea colectarea datelor doar de la un subgrup din cadrul acestor grupuri (ceea ce reprezintă un eşantion). Eşantionarea înseamnă să nu te foloseşti de toată informaţia pe care o ai la dispoziţie.

Abordarea dominantă este realizarea unei analize statistice pe baza datelor disponibile de la un eşantion şi utilizarea rezultatelor ca estimări aplicabile întregii populaţii. De exemplu, să presupunem că o firmă are 300 de expaţi şi a colectat date de la un eşantion de 100 dintre aceştia. Anul acesta, nivelul mediu de satisfacţie al celor 100 de angajaţi cu privire la cursurile de pregătire pentru expaţi ale firmei este de 3,8, pe o scară valorică de la 1 până la 5 (5 însemnând „foarte satisfăcut”, 1 însemnând „foarte nesatisfăcut”). În ultimii doi ani, când firma a verificat acelaşi lucru şi a colectat date de la toţi expaţii, scorul mediu de satisfacţie a fost de 4,2 în ambii ani. Managerul de HR ar putea concluziona că trebuie să schimbe structura cursurilor, deoarece statisticile sunt negative.

Aşa arată schema reprezentativă:  

Dar este această interpretare corectă?

Problema acestei concluzii este că se bazează pe premisa că scorul obţinut pe eşantionul de 100 de persoane este acelaşi lucru cu scorul obţinut pe întregul grup, lucru care este incorect. Dacă datele erau colectate de la un subgrup diferit, scorul mediu de satisfacţie ar fi putut fi 3,5, 4,0 sau chiar 4,5, din simplul motiv că managerul de HR a ales, din pură întâmplare, expaţi mai mult sau mai puţin mulţumiţi în eşantionul vizat. Prin urmare, avem un indicator al modului în care toţi cei 300 de expaţi evaluează cursul de pregătire, dar este un rezultat bazat pe un eşantion (care ne spune că scorul mediu de satisfacţie este 3,8 anul acesta). Aşadar, există un anumit nivel de incertitudine în legătură cu acest rezultat; ar putea la fel de bine să fie unul diferit. Dacă managerii nu iau în calcul factorul de incertitudine, s-ar putea ca aceştia să suprainterpreteze sau să subinterpreteze rezultatele.

Spre exemplu, să presupunem că în realitate toţi cei 300 de manageri au un nivel de satisfacţie de 4,2, în timp ce eşantionul de 100 de persoane ne spune că scorul este de 3,8, din cauza prezenţei unor indivizi nemulţumiţi în cadrul eşantionului. Putem trage concluzia că aceste cursuri sunt încă bune. Dar dacă toţi managerii ar avea un nivel mediu de satisfacţie de 3,6 (iar eşantionul nostru ar arăta încă scorul de 3,8), atunci ar trebui să ne îngrijorăm că ceva este în neregulă cu programul de pregătire. Aşadar, dacă managerii presupun pur şi simplu că o statistică de tipul unui scor mediu al unui eşantion este acelaşi lucru cu scorul pentru populaţia totală, ar putea să greşească. Aceste erori pot duce la subinterpretarea datelor (managerul nu ar trebui să schimbe structura cursului deoarece nu există dovezi în ceea ce priveşte nemulţumirea faţă de acesta) sau la supraintepretarea datelor (managerul ar trebui să schimbe structura cursului, dar nu o face) – ambele decizii constituind greşeli care consumă atât bani, cât şi timp.

Soluţia:

În statistică, rezultatele obţinute în urma colectării datelor pe un eşantion au denumirea de „estimare punctuală”. O estimare punctuală propriu-zisă este un punct bun de plecare atunci când ne gândim la întreaga populaţie, dar acest procedeu nu oferă nicio siguranţă şi în ceea ce priveşte acurateţea datelor, deoarece nu ia în considerare factorul de incertitudine. Vestea bună este următoarea: dacă eşantionarea s-a făcut în mod aleatoriu, statisticile ne pot oferi un indiciu cu privire la rata de eroare a analizei, ca urmare a provenienţei datelor de la un eşantion mai mic decât numărul total al populaţiei. Nu vom şti niciodată 100% sigur care este valoarea corectă pentru întreaga populaţie (nivelul corect de satisfacţie al întregului grup) până când nu vom colecta date de la toate persoanele. Totuşi, putem aborda problema folosind intervalele de încredere.

Intervalele de încredere se mai numesc şi „estimări prin intervale de încredere”. Contrar estimării punctuale, o estimare prin interval de încredere oferă o gamă întreagă de estimări potenţiale ale populaţiei, care pot fi adevărate. Pentru exemplul nostru de mai sus, în loc să presupunem că scorul de 3,8 se aplică şi pentru subgrup, şi pentru grup, ar trebui să calculăm intervalul de încredere şi să ne bazăm concluzia pe ideea că putem fi 95% siguri că nivelul mediu de satisfacţie al întregului grup se află undeva între 3,6 şi 4,0.

Ideea în legătură cu intervalul de încredere este că rezultatele obţinute în acest fel de pe urma datelor colectate pot fi foarte diferite: ne-am mutat de la o simplă estimare punctuală (3,8) la o estimare prin interval de încredere (este foarte probabil ca nivelul mediu de satisfacţie al expaţilor să se afle undeva între 3,6 şi 4,0), prin urmare, s-ar putea să luăm o decizie diferită. În acest caz, diferenţa dintre 4,2 şi 4,0 nu este atât de mare încât să fie necesară restructurarea cursului. 

Aşadar, dacă luăm în considerare mai degrabă eşantionarea aleatorie şi estimarea prin intervale de încredere în locul estimării punctuale, admitem faptul că datele estimative despre populaţie sunt, la un anumit nivel, incerte şi astfel suntem mai bine pregătiţi în a evita deciziile nefavorabile, generatoare de costuri.

Urmărește Business Magazin

Preluarea fără cost a materialelor de presă (text, foto si/sau video), purtătoare de drepturi de proprietate intelectuală, este aprobată de către www.bmag.ro doar în limita a 250 de semne. Spaţiile şi URL-ul/hyperlink-ul nu sunt luate în considerare în numerotarea semnelor. Preluarea de informaţii poate fi făcută numai în acord cu termenii agreaţi şi menţionaţi in această pagină.