Texto de Giulia Giacomello Pompilio
Você já parou para pensar como o Google ou a Alexa são capazes de entender o que você diz a eles, enquanto outros seres humanos, que moram a apenas alguns quilômetros de você, não te entendem? Como pode uma caixa de som conversar com você? Ou, mais absurdo ainda, como pode um bot como a Siri recusar uma proposta de casamento? Você já imaginou como é possível você começar a digitar para o seu amigo “Que vontade…” e seu celular sugerir “de trancar a faculdade e ver Netflix o dia todo”, e era exatamente isso que você ia falar? Ou ainda como você, que nasceu falante da sua língua portuguesa, e a estudou durante anos na escola, quando vai criar um post, seu celular, uma máquina, tem a audácia de sugerir que sabe mais que você e te corrige? Como é possível a tecnologia saber mais da gente do que nós mesmos? Quem os ensinou?
O que a linguagem tem a ver com a máquina? E o que isso tem a ver comigo?
Para responder a todas essas perguntas, precisamos entender o que é Processamento da Linguagem Natural, ou PLN. É um campo em desenvolvimento que estuda as possibilidades de interação entre as áreas da linguagem e da computação – isso mesmo, se você é uma pessoa de exatas e humanas, esse pode ser o caminho pra você! Esse conceito navega entre os campos de Inteligência Artificial, Machine Learning e Deep Learning, ou seja, contribui para que a máquina copie o comportamento humano, assim como para seu aprendizado contínuo. Desse modo, PLN é uma ferramenta que permite a comunicação entre máquina e humano como iguais, sem que o humano tenha que aprender a programar, e sim fazendo com que a máquina entenda a gente!
Então, se você usa corretor automático, pede para sua caixinha de som tocar uma música, grita socorro para o Waze te levar ao lugar certo, ou usa geração de legenda automática do YouTube, o PLN é uma grande parte da sua vida (e você nem sabia)!
A evolução do PLN: a máquina pensa?
Pode-se dizer que tudo isso começou na Segunda Guerra Mundial, quando Alan Turing criou o primeiro computador para decodificar mensagens alemãs criptografadas nas máquinas “Enigma”, um dilema considerado, até então, impossível de se resolver. Com essa finalidade, foi criada a primeira máquina capaz de realizar tradução, ao transformar códigos, alterados diariamente, em palavras. Essa trama é ilustrada no belíssimo filme O Jogo da Imitação, de 2014.
O funcionamento do computador de Alan Turing pode ser comparado a uma teoria matemática, facilmente aplicada à linguística, que surgiu também durante os anos 40, a Teoria da Informação. Ela tenta explicar o funcionamento do processo de comunicação/ transferência de sinais, que começa com a intenção e codificação do falante, ou código criptografado; em seguida, a mensagem é emitida/ recebida; ela passa pelo processo de decodificação (pela máquina ou cérebro do receptor); e, por fim, há a interpretação da mensagem captada, o que permite uma reação ou resposta do ouvinte. Fica claro, assim, que computadores se tornam uma metáfora perfeita para o cérebro, já que Turing “[…] tentou imitar o jeito humano de computar”, segundo a matemática Isabel Cafezeiro. Isso quer dizer que, estudando as faculdades mentais no processo de decodificação de uma mensagem, foi possível criar um computador que nos imitasse!
Aproximadamente 40 anos depois, John Searle cria o argumento do Quarto Chinês, ótima metáfora para explicar o PLN. Ele implica em uma pessoa fechada em um quarto, com apenas uma porta de contato com o mundo exterior, para que inputs e outputs sejam realizados. Nesse quarto, há instruções de como traduzir símbolos chineses para a língua nativa de quem estiver lá dentro (e vice-versa), possibilitando reagir em chinês aos símbolos recebidos. PLN funciona da mesma maneira: um programador ensina sua língua para a máquina através de um manual de instruções de como reagir a outros humanos. Parece, aos olhos daquele que fala chinês, que a sala o está entendendo e respondendo de acordo, mas na realidade trata-se de um mero programa, o qual Searle afirma que é desprovido de faculdades cognitivas. Assim, um computador pode pensar, porém sem sinais de consciência, ou seja, com ausência de intencionalidade, significação e interpretação. Contudo, os filmes Ex-Machina (2014) e Ela (2013) extrapolam esse questionamento e nos mostram um mundo, possivelmente não tão distante, em que o PNL seria capaz de evoluir a ponto de apresentar intenções, desejos e sentimentos.
PLN e a Teoria do Labirinto
Mas como essa comunicação com a máquina realmente acontece? Afinal, a linguagem é um processo extremamente complexo para os humanos, principalmente a linguagem oral, possuindo ruídos, erros gramaticais, dialetos, divergências na pronúncia de palavras, gírias e ambiguidades. Vamos relembrar algumas ambiguidades com as quais a nossa fiel escudeira Alexa pode se deparar:
a. Lexical: causada por uma palavra
Exemplo: “Alexa, me diga um bom prato”. Alexa deve mencionar uma refeição francesa ou dizer o melhor tipo de porcelana no mercado?
b. Estrutural: causada pela posição de uma palavra na frase
Exemplo: “Olhe meu irmão enquanto toca música!”. Alexa deve observar alguém tocar para ela ou tocar para a pessoa enquanto é sua babá?
Se até para nós fica difícil de identificar e discernir ambiguidades, como uma máquina, desprovida de cognição, pode fazê-lo? Para os humanos, passamos pelo que é chamado de Teoria do Labirinto, onde a mente é o labirinto, e cabe a nós escolher o melhor caminho (processos mentais) para realizar tarefas. Ela é baseada nos princípios de Primazia da Sintaxe e Parser (análise sintática). O primeiro defende que mecanismos da linguagem que nós utilizamos são operações sintáticas básicas, como “merge” – isso mesmo, “merge” também é um termo computacional muito conhecido, que se trata de uma concatenação não aleatória. Parser, por sua vez, é capaz de resolver nosso problema, já que trata da ordem prioritária escolhida pelo cérebro no caso de ambiguidades, ou seja, qual caminho do labirinto deve ser tomado. Entre duas estruturas distintas, aquela com maior simplicidade sempre será escolhida, ou seja, a que possui um léxico que é acessado com maior frequência terá preferência. Programas como Siri, Alexa e Google funcionam da mesma maneira! Eles possuem dicionários, que podem ajudar no caso de ambiguidades lexicais, relacionando a palavra ambígua com outras palavras da frase e acionando o significado mais provável, algoritmos de árvores de decisão, que trabalham através de modelos estatísticos para escolher a alternativa mais plausível, e aprendizagem automática, que possibilita que o algoritmo melhore ao passo que te “conhece” melhor.
Ainda há muitos desafios pela frente, e esse é um tópico em constante desenvolvimento, porém vem apresentando evoluções extremamente promissoras. Como foi sabiamente colocado por Alan Turing no filme O Jogo da Imitação, “Quando as pessoas falam umas com as outras, elas nunca dizem o que querem dizer. Elas dizem outra coisa e é esperado que você saiba o que elas querem dizer.” Afinal, se não somos capazes nem de entender a nós mesmos, quem somos nós para exigir que a Siri entenda?
Referências
O que é NLP e como as máquinas podem entender nossa linguagem?
https://blog.dsbrigade.com/o-que-e-nlp-e-como-as-maquinas-podem-entender-nossa-linguagem/
Processamento de Linguagem Natural – SAS
https://www.sas.com/pt_br/insights/analytics/processamento-de-linguagem- natural.html
Muitas carreiras de IA podem começar com um diploma em Linguística
https://cio.com.br/tendencias/muitas-carreiras-de-ia-podem-comecar-com- um-diploma-em-linguistica/
Processamento de Linguagem Natural – Wikipedia
https://pt.wikipedia.org/wiki/Processamento_de_linguagem_natural
Processamento de Linguagem Natural – Sputnik Works
https://sputnik.works/blog/2020/01/01/processamento-de-linguagem-natural
Análise Sintática – Wikipedia
https://pt.wikipedia.org/wiki/An%C3%A1lise_sint%C3%A1tica_(computa% C3%A7%C3%A3o)
Muito interessante o assunto, espero ver mais publicações desta autora no futuro.
É bom constatar que ainda existem pessoas pensando apesar da grande invasão de "máquinas". Obrigado