Wednesday, August 18, 2010

Dve muve jednim udarcem

Brojni web servisi su pogodna mesta za web botove - internet softver aplikacije koje izvršavaju automatizovane radnje kao prikupljanje podataka. Servisi kao Facebook ne žele da ove aplikacije pristupaju njihovom sajtu i izvlače iz njega informacije koje mogu biti zloupotrebljivane, a jedan naučnik iz Gvatemale po imenu Luis von Ahn je izumeo sistem koji ne samo da štiti web sajtove od botova, već u isto vreme i pomaže da se digitalizuju štampani tekstovi.

Radi se o sistemu po imenu reCAPTCHA koji korisnicima servisa pokazuje dve distorzirane reči koje korisnik treba da prepozna i unese. Ove reči su reči iz pisanih izvora koje softver za optičko prepoznavanje karaktera nije mogao definitvno da prepozna, tj. kada se dva različita softvera koji skeniraju jedan isti tekst ne slože po pitanju neke reči. Ta reč se korisniku prikazuje sa još jednom, kontrolnom reči koja je poznata softveru, i pretpostavlja se da će korisnik prepoznati i nepoznatu reč ako može da pročita kontrolnu.

Trenutno se digitalizuje arhiva New York Times-a. 20 godina je već završeno, a još 110 godina bi trebalo da bude gotovo do kraja 2010. godine.

Svet računara ne prestaje da nas oduševljava, a ako još uvek ne znate gde kupiti računar, obratite se Grappolu.

No comments:

Post a Comment