Pessoal,
Recentemente assisti uma palestra[1] fantástica no Google Video que
fazia parte da série Google Talks do criador da idéia do Captcha[2]
(para quem não sabe, captcha são aquelas imagens distorcidas que
dificilmente podem ser interpretadas por um computador e por essa
razão são usadas para evitar o acesso à sites por robôs).
A palestra é perfeita. Divertida, bem apresentada e com idéias
fantásticas sobre o uso prático do poder de processamento humano que
muitas vezes é gasto jogando Paciência :)
Depois de assistir essa palestra eu comecei a prestar mais atenção à
todos os tipos de projetos que fazem uso desse poder de
processamento[3].
Nessa semana chegou ao meu conhecimento o projeto "reCAPTCHA"[4] que
pretende usar os captchas e o poder de processamento da mente humana
para ajudar na digitalização de livros e no reconhecimento de escrita
(OCR) utilizado nesses projetos.
A idéia é simples: o reCAPTCHA pega uma palavra que não foi
reconhecida pelo OCR e uma palavra válida qualquer. Aplica o mesmo
tipo de distorção nessas palavras, embaralha as duas e exibe para o
usuário.
O usuário então tem que digitar as duas palavras corretamente para
poder ser autenticado. O usuário tem que digitar as duas palavras
corretamente porque ele não sabe qual das duas é a palavra legítima e
qual é a imagem não interpretada pelo OCR.
A mesma palavra não identificada então é enviada para mais alguns
outros CAPTCHAS para que seja possível calcular a confiabilidade das
respostas.
Já não bastasse essa idéia simples, útil e genial para me fazer
escrever esse e-mail eu ainda descobri que a tecnologia foi
desenvolvida em Python[5] usando Django, PIL e SoX (em conjunto com o
lighttpd e MySQL).
Sugiro dar uma olhadinha no projeto e equipar os seus sites com um reCAPTCHA :)
Obrigado,
Osvaldo
[1] http://video.google.com/videoplay?docid=-8246463980976635143
[2] http://en.wikipedia.org/wiki/Captcha
[3] http://images.google.com/imagelabeler/
[4] http://recaptcha.net/
[5] http://recaptcha.net/aboutus.html
--
Osvaldo Santana Neto (aCiDBaSe)
http://www.pythonologia.org