DOE AGORA Qualquer valor

OSINT: Como extrair texto de uma imagem ou vídeo

OSINT: Como extrair texto de uma imagem ou vídeo

Todos se perguntaram o que um pedaço de texto estrangeiro significa em uma placa, banner ou em um vídeo. Claro que você pode digitá-lo no google tradutor ou falar o idioma. Mas o que você pode fazer se não souber o idioma? E também o que você pode fazer se o idioma não fizer parte do alfabeto latino e for coreano, por exemplo? Bem, felizmente há uma correção. E está tudo disponível em poucos cliques.

Neste artigo, vou explorar como podemos “ extrair texto de uma imagem ou vídeo ” e traduzi-lo para um inglês legível. Além disso, vamos explorar como isso pode ser usado em uma pesquisa.

OCR (Reconhecimento Óptico de Caracteres):

OCR significa “ Reconhecimento Óptico de Caracteres ”. É uma tecnologia que reconhece texto dentro de imagens digitais. É comumente usado para reconhecer texto em documentos digitalizados. Mas podemos usar essa tecnologia para reconhecer texto estrangeiro encontrado em imagens e vídeos para traduzi-los.

E um dos meus aplicativos favoritos para fazer isso é o Yandex

Então, para começar, vamos traduzir a primeira imagem que vimos acima:

Parece que esta imagem é um protesto, então vamos descobrir do que se trata o protesto.

Depois de inserir a imagem acima no Yandex , você deverá ver um botão que diz “ Texto reconhecido ” clique nele. Se o Yandex não reconhecer imediatamente o texto, você pode clicar no botão “ Selecionar área de corte ” e cortar a imagem para destacar o texto.

E depois que o texto foi reconhecido com sucesso. Clique no botão “ traduzir ” no Yandex (você também pode usar o google tradutor ). E quando está traduzindo a gente vê “ la Reforma Laboral Utilidade Inútil que o trabalho inútil ” se traduz em “ Inútil Reforma Ineficaz Inútil ”. Então agora sabemos que esse protesto é sobre a reforma trabalhista.

Identificando uma pessoa:

OCR (Optical Character Recognition) Também pode ser usado para identificar uma pessoa, permite identificar o nome deste político.

Então vamos repetir os passos que fizemos da última vez e clicar no botão que diz “ Texto reconhecido ”. E vamos clicar em traduzir para sabermos qual é o nome desse Político. E o nome se traduz em “王 岐 山” ou “ Wang Qishan ”.

E com uma rápida pesquisa no google ou pesquisa duckduckgo , se preferir. Podemos descobrir que ele é o vice-presidente da República  popular  da China.

Traduções ruins:

Agora, às vezes, a tradução está simplesmente errada. E o que você pode fazer para combater isso é executar uma pesquisa nesse texto reconhecido e extraído. E muitas vezes você obtém os resultados pretendidos. Ou lhe dará algo que você pode usar para encontrar os resultados pretendidos.

Outras ferramentas de OCR:

Outra ferramenta de OCR que gostaria de compartilhar com você é o i2OCR, que é um Reconhecimento Óptico de Caracteres (OCR) online gratuito que extrai texto de imagens e documentos digitalizados para que possa ser editado, formatado, indexado, pesquisado ou traduzido.

Google Lens:

Outra que é uma das minhas ferramentas de OCR favoritas junto com o Yandex . Que eu gostaria de compartilhar com você é o Google Lens . Esta ferramenta feita pelo Google que permite digitalizar uma imagem e convertê-la em texto que é editável e também pode ser copiado e colado. Mas esse recurso está disponível apenas no aplicativo Android Google Lens . Mas a versão embutida no mecanismo de pesquisa do Google também funciona bem.

Você pode simplesmente fazer upload ou copiar e colar sua imagem no google e clicar no botão quadrado.

Exemplo de botão do Google Lens!
Aplicativo Google Lens para Android em ação!
Google Lens na App Store!

O Google Lens também permite identificar objetos em imagens como plantas, animais, roupas semelhantes, móveis, decoração, rostos e a lista continua.

Exemplo (Cara):

Lista de ferramentas:

Comentários

Ebook

Postagens mais visitadas