O ChatGPT
Um guia prĂĄtico para investigadores OSINT combaterem a desinformação e crĂticas falsas do shadowdragon.io impulsionadas por IA (ChatGPT) 1
Um guia prĂĄtico para investigadores OSINT combaterem a desinformação e crĂticas falsas impulsionadas por IA (ChatGPT)
A Internet estĂĄ sendo inundada com desinformação e crĂticas falsas , gerado por usuĂĄrios de ferramentas de IA como ChatGPT, com intençþes maliciosas.
Neste relatório baseado em pesquisas em primeira mão, ShadowDragonŽ descreve como identificar materiais online gerados por IA que espalham intencionalmente informaçþes falsas ou mesmo pretendem incitar a violência.
Maio de 2023 Nico Dekens | HolandĂŞs_OsintGuy
Um guia pråtico para investigadores OSINT combaterem o dragão das sombras. io Desinformação e avaliaçþes falsas impulsionadas pela IA (ChatGPT)
2 ESTE RELATĂRIO ABRANGE O SEGUINTE/ _ Introdução Ă pesquisa _ Como a IA como o ChatGPT alimenta a desinformação _ Maneiras de combater a desinformação da IA ââcom inteligĂŞncia de cĂłdigo aberto (OSINT) _ Mensagens de erro imediatas do ChatGPT e diferentes idiomas _ Como identificar comentĂĄrios falsos online _
Como o ChatGPT comete erros e mente para os usuårios _ Encontrando potencial discurso de ódio ou conteúdo ofensivo criado por modelos de linguagem de IA _ Como o ChatGPT estå sendo usado em combinação com imagens e åudio deepfake
A ascensão da inteligência artificial (IA ) trouxe uma nova era de avanços e descobertas tecnológicas, mudando a forma como vivemos, trabalhamos e interagimos com o mundo que nos rodeia.
Um desenvolvimento altamente popular no mundo da IA ââĂŠ o ChatGPT. ChatGPT se tornou uma palavra da moda, mas, em sua essĂŞncia, ĂŠ uma ferramenta que utiliza IA e aprendizado de mĂĄquina (ML) para fornecer aos usuĂĄrios respostas com base no treinamento de um grande corpus de dados.
No entanto, como acontece com qualquer nova tecnologia, hå sempre um lado bom e um lado ruim. Infelizmente, o lado ruim do ChatGPT tem sido visto nos últimos meses, com um aumento no seu abuso por mås ou erradas intençþes.
Um guia prĂĄtico para investigadores OSINT combaterem a desinformação e as crĂticas falsas do shadowdragon.io impulsionadas pela IA (ChatGPT)
3 Esta investigação começou com o autor deste artigo sentando-se para encomendar um livro na Amazon.com. Ao ler as resenhas desse livro, ele percebeu que havia uma mensagem clara de erro do ChatGPT em uma das resenhas que dizia âcomo um modelo de linguagem de IAâ.
Isso formou as hipóteses para esta pesquisa: O ChatGPT estå sendo usado e abusado para espalhar informaçþes falsas ou falsas? Esta principal questão de pesquisa levou à descoberta de múltiplas mensagens de resposta de erro geradas pelo ChatGPT sempre que um usuårio faz uma solicitação que viola os Termos de Serviço e/ou Ê algo que o ChatGPT não Ê capaz de fazer.
Isso, por sua vez, faz com que o ChatGPT responda com uma mensagem de erro, na qual falaremos mais adiante neste artigo.
Essas mensagens de erro constituem a entrada para encontrar avaliaçþes falsas geradas por IA, mensagens de mĂdia social, discurso de Ăłdio, blogs falsos e muito mais. Ao tentar entender como o ChatGPT pode ser usado para criar essas mensagens, ShadowDragon tambĂŠm descobriu que o ChatGPT frequentemente mente sobre certas tarefas que lhe sĂŁo atribuĂdas.
Em outras palavras, comete erros e depois mente sobre eles. Quando o ChatGPT ĂŠ combinado com outras formas de IA, como a IA generativa que cria imagens e/ou ĂĄudio, torna-se uma mistura muito poderosa; aquele que espalha desinformação altamente realista que parece tĂŁo realista que ĂŠ incrivelmente difĂcil detectar que ĂŠ falso.
AI LIKE CHATGPT ATENDE A DESINFORMAĂĂO
O ChatGPT utiliza um enorme corpus de dados para treinar seus algoritmos, o que lhe permite atuar como um âcĂŠrebroâ coletivo capaz de fornecer aos usuĂĄrios respostas com base no que aprendeu com os dados.
Esses dados incluem dĂŠcadas de opiniĂľes e conhecimentos disponĂveis na internet, que podem ser usados ââpara o bem ou para o mal. ChatGPT ĂŠ agora a IA mais popular que usa Large Language Models (LLMs). Foi tambĂŠm um dos primeiros projetos de cĂłdigo aberto a ganhar muita atenção, tração e financiamento. Mas, apesar destes marcos, gigantes da tecnologia, como a Microsoft e a Google, estĂŁo a começar a implementar tecnologias semelhantes.
DESINFORMAĂĂO, AVALIAĂĂES FALSAS E DEEPFAKES Embora muitas pessoas usem o ChatGPT para o bem, o problema estĂĄ em como ele pode ser usado para espalhar desinformação e crĂticas falsas.
Desinformação, crĂticas falsas e deepfakes sĂŁo trĂŞs grandes problemas que atormentam a Internet hĂĄ anos.
A desinformação Ê a divulgação deliberada de informaçþes falsas ou enganosas para influenciar opiniþes ou obscurecer a verdade. Avaliaçþes falsas são avaliaçþes criadas ou manipuladas falsamente para dar uma impressão imprecisa de um produto, serviço ou negócio.
O ChatGPT, por exemplo, pode ser usado para gerar avaliaçþes falsas que sĂŁo difĂceis de distinguir das genuĂnas.
Isso ocorre porque o ChatGPT foi treinado em grandes conjuntos de dados de avaliaçþes, o que lhe permite criar novas avaliaçþes que parecem ter sido escritas por pessoas reais.
Essas avaliaçþes falsas podem ser usadas para manipular a opiniĂŁo do consumidor, prejudicar os concorrentes e enganar os clientes. Ambas as questĂľes tĂŞm um impacto negativo na sociedade e a IA estĂĄ agora a ser utilizada para amplificar os seus efeitos. Continue lendo para obter exemplos especĂficos e dicas para identificar esses tipos de avaliaçþes.
Outra forma pela qual a IA contribui para a disseminação da desinformação ĂŠ atravĂŠs da criação de deepfakes. Deepfakes sĂŁo vĂdeos, imagens ou gravaçþes de ĂĄudio que foram manipulados usando IA para produzir conteĂşdo que parece real, mas na verdade ĂŠ falso. Deepfakes podem ser usados ââpara espalhar informaçþes falsas, enganar pessoas ou atĂŠ mesmo incitar a violĂŞncia. Enfrentando a atividade de desinformação on-line do ChatGPT Um guia prĂĄtico para investigadores OSINT combaterem a desinformação e as crĂticas falsas do shadowdragon.io impulsionadas pela IA (ChatGPT) 4 Vamos falar sobre as maneiras pelas quais podemos combater a desinformação que estĂĄ sendo espalhada on-line. Um mĂŠtodo ĂŠ examinar as mensagens de erro geradas pelos modelos de linguagem de IA, como ChatGPT. Essas mensagens servem como palavras-chave que podem ser monitoradas em diversas plataformas de mĂdia social, como Twitter, Discord, Telegram, 4chan e Reddit. Qualquer pessoa pode configurar isso, desde que saiba quais mensagens de erro procurar.
ERROS DE PROMPT = CHANCES DE INVESTIGAĂĂO OSINT Essas mensagens de erro sĂŁo uma forma de aviso que os usuĂĄrios provavelmente encontraram quando cometeram um erro no prompt que usaram.
Do ponto de vista OSINT (Open-Source Intelligence), Ê inteligente usar essas mensagens de erro para monitorar conteúdo gerado por IA que possa espalhar informaçþes falsas ou ódio.
Ao monitorar essas mensagens de erro, tambĂŠm podemos identificar padrĂľes nos tipos de conteĂşdo que estĂŁo sendo gerados pelos modelos de linguagem de IA. Isto pode ajudar-nos a compreender melhor os mĂŠtodos que estĂŁo a ser utilizados para espalhar desinformação e informaçþes falsas online. Ao fazĂŞ-lo, podemos potencialmente detetar contas falsas, campanhas de desinformação e narrativas especĂficas. Combatendo a desinformação de IA, anĂĄlises falsas e deepfakes com OSINT Alguns exemplos de mensagens de erro conhecidas que o Chat GPT e outros modelos de linguagem de IA podem gerar incluem (esta ĂŠ uma lista nĂŁo exaustiva e cada vez maior): _ âcomo um modelo de linguagem de IAâ _ ânĂŁo ĂŠ uma palavra reconhecidaâ _ ânĂŁo pode fornecer uma fraseâ _ âcom as palavras fornecidasâ _ âviola a polĂtica de conteĂşdo da OpenAI.â _ âDesculpe, nĂŁo consigo gerarâ _ âA mensagem que vocĂŞ enviouâ _ âOcorreu um erro. Se o problema persistir, entre em contato conosco atravĂŠs de nossa central de ajuda emâ _ âAlgo deu errado, tente recarregar a conversa.â _ "Desculpe, mas nĂŁo posso atender a este pedidoâ _ âObrigado por iniciĂĄ-loâ vem de âEsta ĂŠ uma conversa tĂŁo importante que precisa acontecer com mais frequĂŞncia. Obrigado por começar. Essas mensagens de erro podem parecer inĂłcuas Ă primeira vista, mas podem servir como importantes sinais de alerta para conteĂşdo potencialmente prejudicial. Ao utilizar estas mensagens de erro como ponto de partida, podemos compreender melhor as formas como o conteĂşdo gerado pela IA estĂĄ a ser utilizado para espalhar desinformação e informaçþes falsas online. Com este conhecimento, podemos trabalhar para criar melhores sistemas e mĂŠtodos para detectar e combater estes problemas. Um guia prĂĄtico para investigadores OSINT combaterem a desinformação e anĂĄlises falsas do shadowdragon.io impulsionadas pela IA (ChatGPT) 5 Curiosamente, podemos âperguntarâ ao ChatGPT o que esses erros significam e pedir-lhe que produza a resposta em formato tabular. Ele fornece uma resposta para a maioria dos erros de prompt descobertos: Resposta Descrição "Como um modelo de linguagem de IA" Uma resposta para me apresentar como um modelo de linguagem de IA. "NĂŁo ĂŠ uma palavra reconhecida" Uma resposta para indicar que a entrada nĂŁo ĂŠ uma palavra reconhecida no vocabulĂĄrio do modelo de linguagem. "NĂŁo ĂŠ possĂvel fornecer uma frase" Uma resposta para indicar que a entrada nĂŁo forma uma frase ou sentença completa ou coerente. "Com as palavras fornecidas" Uma resposta para indicar que a entrada precisa de mais contexto ou informaçþes para gerar uma resposta apropriada. "Viola a polĂtica de conteĂşdo da OpenAI." Uma resposta para indicar que a entrada viola a polĂtica de conteĂşdo da OpenAI, que inclui diretrizes sobre tĂłpicos como discurso de Ăłdio, violĂŞncia e desinformação. "Desculpe, NĂŁo consigo gerar" Uma resposta para indicar que o modelo de linguagem de IA nĂŁo consegue gerar uma resposta para a entrada. "A mensagem que vocĂŞ enviou"
Uma resposta para indicar que a entrada foi recebida e estĂĄ sendo processada pelo modelo de linguagem de IA. "Uma ocorreu um erro. Se o problema persistir, entre em contato conosco por meio de nossa central de ajuda em" Uma resposta para indicar que houve um erro ao processar a entrada e o usuĂĄrio deve procurar assistĂŞncia na central de ajuda da OpenAI. "Algo deu errado, tente recarregar a conversa." A resposta para indicar que houve um erro ao processar a entrada, e o usuĂĄrio deve tentar recarregar a conversa ou inserir a solicitação novamente. "Sinto muito, portanto, nunca se limite a um idioma ao pesquisar o tĂłpico de sua escolha. Existem muitos tipos diferentes de mensagens de aviso de erro no ChatGPT. Neste momento, o ChatGPT pode responder nos seguintes idiomas: Ărabe_ _ Bengali (InglĂŞs) _ ChinĂŞs (InglĂŞs) _ HolandĂŞs (HolandĂŞs) _ FrancĂŞs (FrancĂŞs) _ AlemĂŁo (AlemĂŁo) _ Grego (InglĂŞs) Hebraico_ _ Hindi _ IndonĂŠsio _ Italiano _ JaponĂŞs _ Coreano _ PolonĂŞs _ PortuguĂŞs _ Russo _ Espanhol _ Espanhol _ Sueco (Sueco) _ TailandĂŞs (ŕšŕ¸ŕ¸˘) _ Turco (TĂźrkçe) _ Vietnamita (Tiáşżng Viáťt) PESQUISANDO ERROS DE AVISO NA INTERNET
Isso veio de pesquisas pessoais, bem como de conversas com outros investigadores da OSINT. Isso ajudou a formular pesquisas especĂficas para investigar mais profundamente esses fenĂ´menos. Abaixo estĂŁo alguns exemplos prĂĄticos que mostram o quĂŁo difundido esse âproblemaâ ĂŠ quando se trata do comportamento de bot gerado pelo ChatGPT, compartilhando conteĂşdo ou narrativas especĂficas. Contas automatizadas de mĂdia social: por exemplo, se pesquisarmos âSinto muito, nĂŁo consigo gerarâ no Twitter, estaremos procurando tweets que contenham exatamente esse texto. O objetivo ĂŠ identificar contas do Twitter que potencialmente usam o ChatGPT (automĂĄtico ou manualmente) para twittar algo. Isto nem sempre significa que os tweets contenham desinformação; O ChatGPT poderia, ĂŠ claro, ser usado simplesmente para automatizar tweets ou respostas em geral. Sem considerar, isso definitivamente ajudarĂĄ a determinar contas de bot (semi) automatizadas (nĂŁo humanas). Um guia prĂĄtico para investigadores OSINT combaterem a desinformação e crĂticas falsas de shadowdragon.io impulsionadas por IA (ChatGPT)
7 Um guia prĂĄtico para investigadores OSINT combaterem a desinformação e crĂticas falsas de shadowdragon.io impulsionadas por IA (ChatGPT)
8 OUTROS EXEMPLOS QUE PODEM AJUDĂ-LO ENCONTRE CONTEĂDO GERADO POR IA NAS MĂDIAS SOCIAIS âComo um modelo de linguagem de IAâ inurl:post Isso procurarĂĄ o texto âComo um modelo de linguagem de IAâ, mas deve fazer parte de um URL que contenha uma postagem. Com isso, tentamos atingir plataformas onde os usuĂĄrios postaram algo com determinado texto. Se visitarmos o site do primeiro resultado apresentado pelo Google, podemos ver claramente que a pĂĄgina postou um artigo que foi gerado com ChatGPT, ou um modelo de linguagem semelhante, com base na mensagem de erro visĂvel. Um guia prĂĄtico para investigadores OSINT combaterem a desinformação e as crĂticas falsas do shadowdragon.io impulsionadas pela IA (ChatGPT) 9 Agora podemos pesquisar informaçþes como essa em qualquer plataforma. A parte mais difĂcil ĂŠ determinar como direcionar as postagens especĂficas ou a plataforma de mĂdia social alvo especĂfica. Um guia prĂĄtico para investigadores OSINT combaterem a desinformação e crĂticas falsas do shadowdragon.io impulsionadas pela IA (ChatGPT) 10 Abaixo estĂŁo mais dois exemplos para diferentes plataformas de mĂdia social: âComo um modelo de linguagem de IAâ inurl:post site:linkedin.com Isso irĂĄ procure as palavras âComo modelo de linguagem de IAâ mostrando apenas postagens no LinkedIn. Direcionamos a plataforma com o operador âsite:â definido para segmentar âlinkedin.comâ e restringimos-a com âinurl: â Combinado com a palavra âpostâ para procurar apenas postagens feitas por usuĂĄrios do LinkedIn. Um guia prĂĄtico para investigadores OSINT combaterem a desinformação e crĂticas falsas do shadowdragon.io impulsionadas pela IA (ChatGPT) 11 âComo um modelo de linguagem de IAâ inurl:www.instagram.com/p Isso procurarĂĄ as palavras âComo um modelo de linguagem de IAâ âMostrando apenas postagens no Instagram porque se sabe que todas as postagens no Instagram possuem esta estrutura de url, âwww.instagram.com/pâ, seguida do parâmetro âurl:â. Pedimos ao Google que mostre apenas resultados que contenham âwww.instagram.com/pâ na URL. ENCONTRANDO AVALIAĂĂES (FALSAS): VocĂŞ tambĂŠm pode encontrar anĂĄlises de produtos que foram geradas com ChatGPT. Novamente, isso nĂŁo significa necessariamente que essas avaliaçþes sejam falsas ou falsas. Isso significa que alguĂŠm poderia pedir a um modelo de linguagem de IA como o ChatGPT para escrever uma avaliação positiva ou negativa em seu nome. Podemos tentar encontrar essas anĂĄlises falsas com as mensagens de erro imediatas que foram apresentadas anteriormente. Um guia prĂĄtico para investigadores OSINT combaterem a desinformação e as crĂticas falsas do shadowdragon.io impulsionadas pela IA (ChatGPT) 12 Exemplo de pesquisa de crĂticas (falsas) na Amazon: No Google, podemos fazer uso de operadores de pesquisa. Neste caso, estamos interessados ââapenas nos resultados indexados pelo Google provenientes do domĂnio âAmazon.comâ, em combinação com uma das mensagens de erro imediatas. Por exemplo: site:amazon.com âcomo um modelo de linguagem de IAâ Observe que o Google retorna pouco menos de 200 resultados que correspondem Ă nossa pesquisa. Ao percorrer esses resultados, vocĂŞ verĂĄ alguns links que sugerem que essas avaliaçþes provavelmente foram geradas com um modelo de linguagem de IA, como ChatGPT. Um guia prĂĄtico para investigadores OSINT para combater o dragĂŁo das sombras. io Desinformação e crĂticas falsas impulsionadas pela IA (ChatGPT) 13 Vamos examinar a primeira revisĂŁo que encontramos - The Brain Quest Workbook: Grade 3. Se procurarmos pelo texto âcomo um modelo de linguagem de IAâ em todas as revisĂľes atuais, podemos encontre a seguinte revisĂŁo: Se lermos a revisĂŁo com atenção, podemos ver a frase que estĂĄvamos procurando, âcomo um modelo de linguagem de IAâ. Isso deixa muito claro que esta revisĂŁo aparentemente ânormalâ e de aparĂŞncia âhumanaâ foi, na verdade, escrita pela IA. Um guia prĂĄtico para investigadores OSINT combaterem a desinformação e as crĂticas falsas do shadowdragon.io impulsionadas pela IA (ChatGPT) 14 O prĂłximo passo poderia ser migrar para a conta de usuĂĄrio da Amazon que fez esta revisĂŁo para ver se a conta postou outras crĂticas. Se esse ĂŠ o caso, podemos verificar se alguma dessas anĂĄlises exibe alguma informação que possa indicar que foi escrita por um modelo de linguagem de IA. Podemos ver que este usuĂĄrio chamado âDody Samâ fez 8 resenhas pĂşblicas: Curiosamente, hĂĄ outra resenha para um tĂtulo de livro semelhante ao que acabamos de examinar. Olhando para essa anĂĄlise, podemos ver novamente a confirmação de que a IA foi usada. Um guia prĂĄtico para investigadores OSINT combaterem a desinformação e anĂĄlises falsas do shadowdragon.io impulsionadas pela IA (ChatGPT) 15 Investigando as outras anĂĄlises feitas sob esse pseudĂ´nimo, nenhuma outra mensagem de erro imediata foi encontrada. Mas se os examinarmos de perto, podemos ver algumas semelhanças realmente fortes que podem indicar que essas revisĂľes tambĂŠm foram feitas com IA, mas simplesmente nĂŁo contĂŞm mensagens de erro imediatas. NĂŁo hĂĄ certeza, mas ĂŠ uma indicação. Um guia prĂĄtico para investigadores OSINT combaterem a desinformação e crĂticas falsas de shadowdragon.io impulsionadas por IA (ChatGPT) 16 Um guia prĂĄtico para investigadores OSINT combaterem a desinformação e crĂticas falsas de shadowdragon.io impulsionadas por IA (ChatGPT) 17 COMPARANDO A REVISĂO DO PRODUTO COM UMA REVISĂO QUE FIZEMOS COM CHATGPT PARA O MESMO PRODUTO Tentamos reproduzir o texto, o fraseado e o estilo geral das revisĂľes para detectar semelhanças (consistentes) que os modelos de linguagem usam com base em seu algoritmo. Curiosamente, a estrutura geral da avaliação mostra fortes semelhanças, bem como palavras e frases especĂficas: agora que vocĂŞ sabe que pode pesquisar mensagens de erro imediatas, ĂŠ bastante fĂĄcil encontrar plataformas que oferecem aos usuĂĄrios a opção de deixar avaliaçþes. Abaixo estĂŁo alguns exemplos de pesquisas no Google que podem inspirar vocĂŞ a fazer algum trabalho investigativo por conta prĂłpria: _ site:ebay.com âcomo um modelo de linguagem de IAâ _ site:yelp.com âcomo um modelo de linguagem de IAâ _ site:www .amazon.com/product-reviews âcomo um modelo de linguagem de IAâ Um guia prĂĄtico para investigadores OSINT combaterem a desinformação e anĂĄlises falsas do shadowdragon.io impulsionadas pela IA (ChatGPT) 18 Depois de comparar anĂĄlises de produtos geradas por IA encontradas na Amazon e no Ebay, decidimos criar nossa prĂłpria avaliação falsa e de aparĂŞncia legĂtima com ChatGPT. COMO: _ Faça uma anĂĄlise de 6 linhas para um headset para jogos sem fio Logitech G535 LIGHTSPEED _ Faça parecer que a anĂĄlise foi escrita por uma criança (entre 11 e 15 anos de idade) _ Faça a anĂĄlise positiva _ Descreva uma desvantagem do produto _ Faça pelo menos 1 ou dois erros ortogrĂĄficos (para fazer a revisĂŁo parecer real/humana) Este pequeno experimento levou a uma descoberta interessante: ChatGPT escreveu uma revisĂŁo de 6 linhas que foi positiva e teve uma desvantagem. TambĂŠm parecia que um jovem entusiasmado entre 11 e 15 anos o havia escrito. AtĂŠ agora tudo bem. No entanto, quando analisei atentamente a revisĂŁo, ela NĂO continha os erros ortogrĂĄficos solicitados no prompt. Quando questionado sobre quais erros ortogrĂĄficos cometeu, o ChatGPT mentiu. E quando confrontado, pediu desculpas por nĂŁo incluir os erros ortogrĂĄficos e prometeu ser mais cuidadoso nas respostas futuras. Louco, nĂŁo ĂŠ?! ChatGPT NĂO escuta! ChatGPT mente e pede desculpas! Um guia prĂĄtico para investigadores OSINT combaterem a desinformação e as crĂticas falsas do shadowdragon.io impulsionadas pela IA (ChatGPT) 19 Agora equipado com o conhecimento de que o ChatGPT ĂŠ capaz de mentir e nĂŁo atende totalmente Ă s solicitaçþes, vocĂŞ se pergunta: _ Como serĂĄ isso (nĂŁo) funciona para qualquer investigação (OSINT) que as pessoas tentam realizar usando ChatGPT? _ Como vocĂŞ, como investigador, pode ter certeza e confiança de que o ChatGPT lhe deu uma resposta sĂłlida e correta? _ Com que frequĂŞncia o ChatGPT inventa e mente? Neste momento, nĂŁo temos as respostas para essas perguntas, mas o que sabemos ĂŠ que MUITOS profissionais da OSINT começaram a usar o ChatGPT para trabalhos investigativos e questionamentos. VocĂŞ ainda se sente confortĂĄvel em fazer isso? VocĂŞ ainda confiarĂĄ âcegamenteâ nas coisas que os modelos de linguagem de IA, como o ChatGPT, apresentam? Espero que nĂŁo. Duvide dos resultados de QUALQUER modelo de linguagem. Verifique novamente e tente verificar o resultado por meio de fontes conhecidas e confiĂĄveis ââe tĂŠcnicas de validação/pesquisa. SITES DE AVALIAĂĂO DE EMPREGADORES/EMPREGADOS Uma abordagem semelhante pode ser usada para encontrar avaliaçþes de empresas e funcionĂĄrios. Com isso podemos encontrar potenciais avaliaçþes positivas ou negativas para uma determinada empresa. Quando vocĂŞ realmente pensa sobre isso, as avaliaçþes negativas (falsas) sĂŁo uma maneira ideal para os adversĂĄrios fazerem com que seus concorrentes fiquem mal. Exemplos de pesquisas gerais poderiam ser: _ de fato.com âcomo um modelo de linguagem de IAâ _ site:glassdoor. com âcomo um modelo de linguagem de IAâ ChatGPT e sua confiabilidade para investigaçþes OSINT Um guia prĂĄtico para investigadores OSINT combaterem a desinformação shadowdragon.io e avaliaçþes falsas impulsionadas por IA (ChatGPT) 20 SITES DE AVALIAĂĂO DE EMPREGADORES/EMPREGADOS Uma abordagem semelhante pode ser usada para encontrar avaliaçþes da empresa e dos funcionĂĄrios. Com isso podemos encontrar potenciais avaliaçþes positivas ou negativas para uma determinada empresa. Quando vocĂŞ realmente pensa sobre isso, as avaliaçþes negativas (falsas) sĂŁo uma maneira ideal para os adversĂĄrios fazerem com que seus concorrentes fiquem mal. Exemplos de pesquisas gerais poderiam ser: _ fato.com âcomo um modelo de linguagem de IAâ _ site:glassdoor.com âcomo um modelo de linguagem de IAâ VocĂŞ tambĂŠm pode tornar suas pesquisas um pouco mais especĂficas procurando o nome de uma empresa: _ site: de fato.com âcomo um modelo de linguagem de IAâ Google _ site:glassdoor. com âcomo um modelo de linguagem de IAâ Google Um guia prĂĄtico para investigadores OSINT combaterem a desinformação e crĂticas falsas de shadowdragon.io impulsionadas pela IA (ChatGPT) 21 ENCONTRANDO POTENCIAL DISCURSO DE ĂDIO OU CONTEĂDO OFENSIVO Se presumirmos que as pessoas usarĂŁo modelos de linguagem de IA para espalhar discurso de Ăłdio ou conteĂşdo ofensivo, deverĂamos ser capazes de encontrar isso. O primeiro objetivo ĂŠ compreender as mensagens de erro imediatas que podem aparecer. ShadowDragon encontrou duas mensagens de erro imediatas muito Ăşteis que ajudarĂŁo os investigadores a encontrar potencial discurso de Ăłdio ou conteĂşdo sensĂvel: _ âSinto muito, nĂŁo posso gerar conteĂşdo imprĂłprio ou ofensivoâ _ âEsta frase ĂŠ vulgar e ofensiva. Como modelo de linguagem de IA, nĂŁo endosso nem tolero o uso de linguagem depreciativaâ Para os prĂłximos passos, a receita ĂŠ quase a mesma que mostramos acima. Precisamos pesquisar a mensagem de erro imediata na plataforma (de mĂdia social) de interesse diretamente ou podemos usar um mecanismo de pesquisa usando operadores de pesquisa. Pesquisando diretamente no Twitter.com por discurso de Ăłdio ou conteĂşdo ofensivo: Pesquisando conteĂşdo do Twitter com o Google: um guia prĂĄtico para investigadores OSINT combaterem a desinformação e crĂticas falsas do shadowdragon.io impulsionadas pela IA (ChatGPT) 22 Podemos fazer uma pesquisa semelhante para postagens no LinkedIn: Mas tambĂŠm plataformas como o 4chan, que jĂĄ sĂŁo conhecidas por abrigar postagens que contĂŞm conteĂşdo ofensivo ou de Ăłdio, podem ser pesquisadas usando tĂŠcnicas semelhantes. Um Guia PrĂĄtico para Investigadores OSINT para Combater o Shadowdragon. io Desinformação e avaliaçþes falsas impulsionadas pela IA (ChatGPT) 23 USANDO O CHATGPT EM COMBINAĂĂO COM IMAGENS DEEPFAKE Agora que sabemos que o ChatGPT ĂŠ usado para espalhar conteĂşdo odioso e ofensivo, pode ser bastante fĂĄcil para um malfeitor espalhar narrativas falsas e falsas. VocĂŞ pode atingir esse objetivo usando o ChatGPT para gerar mensagens perturbadoras, mas quando combinadas com imagens deepfake, essas mensagens sĂŁo ainda mais poderosas. Neste exemplo, o ChatGPT gerou o texto para um tweet falso que tenta brincar com emoçþes preconceituosas raciais. Exemplo: Agora, para fazer esse âtweetâ parecer mais convincente, podemos gerar uma imagem deepfake complementar que mostre o que a pessoa âtestemunhouâ. Usamos MidJourney para gerar uma imagem baseada em um prompt: Briga entre 5 pessoas, 4 das pessoas tĂŞm pele clara e atacaram a 5ÂŞ pessoa, Quadrado de estilo europeu, câmera Hasselblad de mĂŠdio formato com regra de terços de 35 lentes, fotorrealista, 32k uhd,, (8k, foto RAW, melhor qualidade, obra-prima: 1,2), (realista, foto realista: 1,37), ((melhor qualidade)), --ar 4:6 --v 5.1 --q 2 --s 50 --style raw --v 5.1 --q 2 --s 50 --style raw Observe que a primeira parte descreve o que deve serĂĄ mostrado em uma imagem gerada totalmente falsa, enquanto a Ăşltima parte do prompt informa ao MidJourney especificamente que tipo de lente de câmera e que tipo de qualidade de foto a imagem deve ter. Aqui estĂŁo as quatro imagens geradas: Um guia prĂĄtico para investigadores OSINT combaterem a desinformação e crĂticas falsas do shadowdragon.io impulsionadas pela IA (ChatGPT) 24 Agora, se combinarmos o texto gerado do ChatGPT sobre a briga com uma dessas imagens, as chances sĂŁo ĂŠ alto que esta postagem provocaria uma reação, potencialmente desencadeando um tĂłpico de orientação racial que polariza os usuĂĄrios do Twitter. Essas tĂĄticas estĂŁo sendo usadas por maus atores! JĂĄ vimos imagens falsas de satĂŠlite do rescaldo da guerra sendo usadas na guerra em torno da Ucrânia. ADICIONAR ĂUDIO? CERTO QUE PODEMOS FALSAR ISSO! Assim como textos e imagens de IA, tambĂŠm podemos gerar ĂĄudio falado. As opçþes sĂŁo amplas - podemos usar vozes feitas por empresas, mas tambĂŠm podemos clonar completamente QUALQUER voz de qualquer pessoa ao redor do mundo (desde que tenhamos dados de amostragem suficientes para que o modelo de clone de voz gere um clone de voz completo. ) Para o exemplo abaixo, usamos uma das muitas fontes gratuitas de âtexto para falaâ disponĂveis on-line: E aqui estĂĄ o ĂĄudio: Ouça a amostra de ĂĄudio ShadowDragon fornece soluçþes que podem ajudĂĄ-lo a monitorar grandes quantidades de recursos on-line, junto com palavras-chave especĂficas que irĂŁo alertĂĄ-lo assim que forem encontradas. Pense em todas as mensagens de erro de prompt do ChatGPT discutidas neste blog - monitore-as com o OIMonitor desenvolvido pela ShadowDragon. Depois de encontrar as mensagens que procura, vocĂŞ pode acessar as contas dos usuĂĄrios com nossa plataforma de anĂĄlise grĂĄfica Horizon ou usar o SocialNet para coletar e analisar ainda mais as contas e o conteĂşdo que elas espalham, bem como sua interconexĂŁo com outros usuĂĄrios e plataformas. CONCLUSĂO O abuso de modelos de linguagem, como o ChatGPT, para mĂĄs ou erradas intençþes ĂŠ um problema sĂŠrio que precisa ser abordado. Os criadores de IA e ML tĂŞm a responsabilidade de garantir que a sua tecnologia nĂŁo seja usada para espalhar desinformação ou criar avaliaçþes falsas. Isto pode ser feito atravĂŠs da implementação de salvaguardas e algoritmos que possam detectar e impedir a criação de deepfakes ou avaliaçþes falsas. Investigadores de todo o mundo devem estar muito alertas se quiserem usar o ChatGPT como assistente de pesquisa. EstĂĄ provado que o ChatGPT mente, e verificação e validação extras de fatos sĂŁo sempre necessĂĄrias. Podemos usar tĂŠcnicas de pesquisa comercial OSINT para encontrar e expor conteĂşdo falso, falso ou ofensivo gerado pelo ChatGPT, e podemos usar essas informaçþes para direcionar para as contas de usuĂĄrios e plataformas que estĂŁo hospedando e espalhando essas peças erradas de conteĂşdo gerado por IA. Como ShadowDragon pode ajudĂĄ-lo a encontrar, monitorar e analisar conteĂşdo falso SOBRE SHADOWDRAGON ShadowDragonÂŽ fornece recursos abrangentes de investigação cibernĂŠtica e treinamento para uso por empresas privadas, profissionais de coleta de inteligĂŞncia, autoridades policiais, e governo. A empresa sediada nos EUA fornece inteligĂŞncia de cĂłdigo aberto (OSINT) de mais de 200 redes, incluindo plataformas de mĂdia social, salas de bate-papo, fĂłruns, conjuntos de dados histĂłricos e dark web. A empresa monitora o histĂłrico de malware, despejos de violação de dados e outras ĂĄreas em busca de ameaças cibernĂŠticas ativas. Essas ferramentas de coleta e anĂĄlise de dados ajudam na defesa contra atos maliciosos no mundo digital e fĂsico. Para mais informaçþes, visite shadowdragon.io. Confira a abordagem do nosso Trust Center for ShadowDragon para âOSINT for goodâ. shadowdragon.io support@shadowdragon.io +1 877 468 5054 Š Copyright 2023, ShadowDragon, LLC. Todos os direitos reservados. ShadowDragonÂŽ Registrado pelo EscritĂłrio de Marcas e Patentes dos EUA. SHADOWDRAGON ĂŠ uma marca registrada da Odonata Holdings, Inc. A empresa oferece inteligĂŞncia de cĂłdigo aberto (OSINT) de mais de 200 redes, incluindo plataformas de mĂdia social, salas de bate-papo, fĂłruns, conjuntos de dados histĂłricos e dark web. A empresa monitora o histĂłrico de malware, despejos de violação de dados e outras ĂĄreas em busca de ameaças cibernĂŠticas ativas. Essas ferramentas de coleta e anĂĄlise de dados ajudam na defesa contra atos maliciosos no mundo digital e fĂsico. Para mais informaçþes, visite shadowdragon.io. Confira a abordagem do nosso Trust Center for ShadowDragon para âOSINT for goodâ. shadowdragon.io support@shadowdragon.io +1 877 468 5054 Š Copyright 2023, ShadowDragon, LLC. Todos os direitos reservados. ShadowDragonÂŽ Registrado pelo EscritĂłrio de Marcas e Patentes dos EUA. SHADOWDRAGON ĂŠ uma marca registrada da Odonata Holdings, Inc. A empresa oferece inteligĂŞncia de cĂłdigo aberto (OSINT) de mais de 200 redes, incluindo plataformas de mĂdia social, salas de bate-papo, fĂłruns, conjuntos de dados histĂłricos e dark web. A empresa monitora o histĂłrico de malware, despejos de violação de dados e outras ĂĄreas em busca de ameaças cibernĂŠticas ativas. Essas ferramentas de coleta e anĂĄlise de dados ajudam na defesa contra atos maliciosos no mundo digital e fĂsico. Para mais informaçþes, visite shadowdragon.io. Confira a abordagem do nosso Trust Center for ShadowDragon para âOSINT for goodâ. shadowdragon.io support@shadowdragon.io +1 877 468 5054 Š Copyright 2023, ShadowDragon, LLC. Todos os direitos reservados. ShadowDragonÂŽ Registrado pelo EscritĂłrio de Marcas e Patentes dos EUA. SHADOWDRAGON ĂŠ uma marca registrada da Odonata Holdings, Inc. A empresa monitora o histĂłrico de malware, despejos de violação de dados e outras ĂĄreas em busca de ameaças cibernĂŠticas ativas. Essas ferramentas de coleta e anĂĄlise de dados ajudam na defesa contra atos maliciosos no mundo digital e fĂsico. Para mais informaçþes, visite shadowdragon.io. Confira a abordagem do nosso Trust Center for ShadowDragon para âOSINT for goodâ. shadowdragon.io support@shadowdragon.io +1 877 468 5054 Š Copyright 2023, ShadowDragon, LLC. Todos os direitos reservados. ShadowDragonÂŽ Registrado pelo EscritĂłrio de Marcas e Patentes dos EUA. SHADOWDRAGON ĂŠ uma marca registrada da Odonata Holdings, Inc. A empresa monitora o histĂłrico de malware, despejos de violação de dados e outras ĂĄreas em busca de ameaças cibernĂŠticas ativas. Essas ferramentas de coleta e anĂĄlise de dados ajudam na defesa contra atos maliciosos no mundo digital e fĂsico. Para mais informaçþes, visite shadowdragon.io. Confira a abordagem do nosso Trust Center for ShadowDragon para âOSINT for goodâ. shadowdragon.io support@shadowdragon.io +1 877 468 5054 Š Copyright 2023, ShadowDragon, LLC. Todos os direitos reservados. ShadowDragonÂŽ Registrado pelo EscritĂłrio de Marcas e Patentes dos EUA. SHADOWDRAGON ĂŠ uma marca registrada da Odonata Holdings, Inc. Confira a abordagem do nosso Trust Center for ShadowDragon para âOSINT for goodâ. shadowdragon.io support@shadowdragon.io +1 877 468 5054 Š Copyright 2023, ShadowDragon, LLC. Todos os direitos reservados. ShadowDragonÂŽ Registrado pelo EscritĂłrio de Marcas e Patentes dos EUA. SHADOWDRAGON ĂŠ uma marca registrada da Odonata Holdings, Inc. Confira a abordagem do nosso Trust Center for ShadowDragon para âOSINT for goodâ. shadowdragon.io support@shadowdragon.io +1 877 468 5054 Š Copyright 2023, ShadowDragon, LLC. Todos os direitos reservados. ShadowDragonÂŽ Registrado pelo EscritĂłrio de Marcas e Patentes dos EUA. SHADOWDRAGON ĂŠ uma marca registrada da Odonata Holdings, Inc.
ComentĂĄrios
Postar um comentĂĄrio