Cititorul de poze

Postat la 21 noiembrie 2006 1 afişăre

Programatorii americani au reusit sa dezvolte un soft capabil sa grupeze fotografii in functie de continutul lor si chiar sa descrie personajele care apar in poza.

Programatorii americani au reusit sa dezvolte un soft capabil sa grupeze fotografii in functie de continutul lor si chiar sa descrie personajele care apar in poza.

 

In primul test in afara laboratorului, programul a analizat mii de imagini disponibile public de pe site-ul Flickr.com. In 98% din cazuri, opera echipei de programatori a reusit sa identifice cel putin una dintre cate-goriile in care ar putea fi integrata fotografia.

 

Produsul software, care nu este inca disponibil comercial, poarta denumirea de ALIPR, acronimul in limba engleza pentru "indexare lingvistica automata a fotografiilor". Sistemul pe baza caruia functioneaza foloseste mai multe tehnici statistice pentru a analiza fiecare fotografie si a o descrie alaturandu-i o caracterizare de maxim 15 cu-vinte-cheie. Aceste cuvinte se pot referi la obiecte specifice cuprinse de obiectivul aparatului de fotografiat, ca "masina" sau "per-soana" sau altele mai generale, cum ar fi "peisaj" ori "arhitectura".

 

Daca pentru un om, descifrarea unei fotografii este un proces natural extrem de simplu, pentru computer, care poate totusi gasi in cateva secunde un cuvant in zeci de milioane de pagini de text, pare fara  sorti de izbanda. "Sa faci un calculator sa inteleaga despre ce e o poza este una dintre cele mai dificile probleme pentru cei care studiaza inteligenta artificiala", recunoaste Jia Li, una dintre programatoarele care au contribuit la dezvoltarea ALIPR, matematician la Pennsylvania State University. Dificultatea, explica Li, vine din faptul ca desi in lumea reala obiectele apar in trei dimensiuni, intr-o poza exista doar doua, iar siluetele nu pot fi diferentiate doar in functie de culoare sau textura aparenta a materialelor.

 

Si pentru ca o intelegere a lumii complexe inconjuratoare ramane dincolo de posibilitatile unui simplu calculator, sunt necesari algoritmi puternici de procesare video pentru a ajuta la imitarea simtului vizual al oamenilor. Practic, sistemul nou-inventat analizeaza fotografiile pixel cu pixel si compara informatiile astfel receptionate cu o baza de date prestabilita de imagini si de cuvinte. Echipa de programatori recunoaste ca re-zultatele obtinute la analiza fotografiilor nu sunt intotdeauna cele mai corecte sau cele mai complete, dar ca este un pas important in directia buna. Un alt astfel de pas ar putea fi incercarea de a invata calculatoarele sa faca diferenta intre mirosuri. Dar o baza de date de acest fel este probabil cu mult mai greu de realizat.

Urmărește Business Magazin

Am mai scris despre:
Cititorul de poze
/business-hi-tech/cititorul-de-poze-1007547
1007547
comments powered by Disqus

Preluarea fără cost a materialelor de presă (text, foto si/sau video), purtătoare de drepturi de proprietate intelectuală, este aprobată de către www.bmag.ro doar în limita a 250 de semne. Spaţiile şi URL-ul/hyperlink-ul nu sunt luate în considerare în numerotarea semnelor. Preluarea de informaţii poate fi făcută numai în acord cu termenii agreaţi şi menţionaţi in această pagină.