Google dá acesso a documentos do Holocausto

O motor de busca Google apresentou no ultimo 26 de janeiro um sistema que permitirá o acesso a 130 mil fotografias dos arquivos do Museu do Holocausto, em Israel.

Este sistema, que tem por base a tecnologia OCR (Optical character recognition), e vai permitir, nas palavras do director do museu, Avner Shalev, levar toda uma herança cultural e história mundial às novas gerações. Entre as fotografias e documentos tratados estão vistos, listas de transporte, e testemunhos de sobreviventes, que nunca estiveram disponíveis para o público em geral.

Segundo a Google, estes 130 mil ficheiros são apenas o início deste projecto.

O sistema foi divulgado em Tel Aviv, na véspera do dia reservado à memória das vítimas do Holocausto. Confira o site do Yad Vashem que só no ano passado teve mais de 11 milhões de visitantes.

Fonte: PCGUIA

Tecnologia OCR

A tecnologia conhecida como OCR (Optical Character Recognition) faz exatamente o que seu nome sugere: é capaz de reconhecer um arquivo PDF e converter a imagem em milhares de palavras. Você também pode utilizar um programa OCR para extrair as palavras de um texto escaneado.

Google OCR

Já que o arquivo PDF nada mais é que uma imagem com palavras embutidas — essas palavras podem, então, ser indexadas e encontradas nas buscas, de modo que esses documentos passam a ser mais facilmente encontrados.

Por isso, utilizando tecnologia OCR o Google já encontra texto em documentos escaneados e consegue ler o que está escrito em arquivos PDF.

Anúncios

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s

%d blogueiros gostam disto: