OSINT: Como extrair texto de uma imagem ou vídeo
OSINT: Como extrair texto de uma imagem ou vídeo
Todos se perguntaram o que um pedaço de texto estrangeiro significa em uma placa, banner ou em um vídeo. Claro que você pode digitá-lo no google tradutor ou falar o idioma. Mas o que você pode fazer se não souber o idioma? E também o que você pode fazer se o idioma não fizer parte do alfabeto latino e for coreano, por exemplo? Bem, felizmente há uma correção. E está tudo disponível em poucos cliques.
Neste artigo, vou explorar como podemos “ extrair texto de uma imagem ou vídeo ” e traduzi-lo para um inglês legível. Além disso, vamos explorar como isso pode ser usado em uma pesquisa.
OCR (Reconhecimento Óptico de Caracteres):
OCR significa “ Reconhecimento Óptico de Caracteres ”. É uma tecnologia que reconhece texto dentro de imagens digitais. É comumente usado para reconhecer texto em documentos digitalizados. Mas podemos usar essa tecnologia para reconhecer texto estrangeiro encontrado em imagens e vídeos para traduzi-los.
E um dos meus aplicativos favoritos para fazer isso é o Yandex
Então, para começar, vamos traduzir a primeira imagem que vimos acima:
Parece que esta imagem é um protesto, então vamos descobrir do que se trata o protesto.
Depois de inserir a imagem acima no Yandex , você deverá ver um botão que diz “ Texto reconhecido ” clique nele. Se o Yandex não reconhecer imediatamente o texto, você pode clicar no botão “ Selecionar área de corte ” e cortar a imagem para destacar o texto.
E depois que o texto foi reconhecido com sucesso. Clique no botão “ traduzir ” no Yandex (você também pode usar o google tradutor ). E quando está traduzindo a gente vê “ la Reforma Laboral Utilidade Inútil que o trabalho inútil ” se traduz em “ Inútil Reforma Ineficaz Inútil ”. Então agora sabemos que esse protesto é sobre a reforma trabalhista.
Identificando uma pessoa:
OCR (Optical Character Recognition) Também pode ser usado para identificar uma pessoa, permite identificar o nome deste político.
Então vamos repetir os passos que fizemos da última vez e clicar no botão que diz “ Texto reconhecido ”. E vamos clicar em traduzir para sabermos qual é o nome desse Político. E o nome se traduz em “王 岐 山” ou “ Wang Qishan ”.
E com uma rápida pesquisa no google ou pesquisa duckduckgo , se preferir. Podemos descobrir que ele é o vice-presidente da República “ popular ” da China.
Traduções ruins:
Agora, às vezes, a tradução está simplesmente errada. E o que você pode fazer para combater isso é executar uma pesquisa nesse texto reconhecido e extraído. E muitas vezes você obtém os resultados pretendidos. Ou lhe dará algo que você pode usar para encontrar os resultados pretendidos.
Outras ferramentas de OCR:
Outra ferramenta de OCR que gostaria de compartilhar com você é o i2OCR, que é um Reconhecimento Óptico de Caracteres (OCR) online gratuito que extrai texto de imagens e documentos digitalizados para que possa ser editado, formatado, indexado, pesquisado ou traduzido.
Google Lens:
Outra que é uma das minhas ferramentas de OCR favoritas junto com o Yandex . Que eu gostaria de compartilhar com você é o Google Lens . Esta ferramenta feita pelo Google que permite digitalizar uma imagem e convertê-la em texto que é editável e também pode ser copiado e colado. Mas esse recurso está disponível apenas no aplicativo Android Google Lens . Mas a versão embutida no mecanismo de pesquisa do Google também funciona bem.
Você pode simplesmente fazer upload ou copiar e colar sua imagem no google e clicar no botão quadrado.
O Google Lens também permite identificar objetos em imagens como plantas, animais, roupas semelhantes, móveis, decoração, rostos e a lista continua.
Comentários
Postar um comentário