Como definir a inteligência artificial (IA)? Talvez pela capacidade de impedir um humano a desativá-la… Já vimos isto (quase) a acontecer na ficção, nomeadamente no filme “2001: Odisseia no Espaço”, de Stanley Kubrick. Mas, num momento em que a ficção já se tornou realidade inúmeras vezes, este é um tema que motiva alguma preocupação. 

E é uma preocupação para dois cientistas: Laurent Orseau (que trabalha numa empresa da Google especializada em IA) e Stuart Armstrong, da Universidade de Oxford. 

O objetivo das suas investigações é estabelecer um quadro em que o "agente inteligente” não aprenda a impedir a sua interrupção. E isto porque pode efetivamente ser necessário, para um humano, carregar no botão vermelho para desativar um programa por este ter-se tornado perigoso.

E, agora algo que vos surpreenderá: uma das técnicas de aprendizagem dos agentes inteligentes é similar à dos animais domésticos! Funciona com um sistema de recompensa que os incentiva a atingir os objetivos. E acreditem que podem recorrer a métodos triviais para conseguir um determinado fim! 

Foi o caso de um programa que tinha “colocado em pausa“ o jogo do Tetris para não perder.

Desta forma, um agente inteligente poderia desativar o botão vermelho de forma a impedir a ação que o faria “desligar” e, assim, alcançar o seu objetivo.

Para evitar situações como a descrita, a abordagem dos dois cientistas consiste em fazer acreditar ao agente inteligente que as intervenções humanas não interferem com as tarefas a efetuar, de modo que tenha a “sensação” que ele próprio, sozinho, decide o modo de execução.

Os especialistas garantem que não existe, hoje, um programa capaz de impedir a sua desativação, mas como dizem os nossos dois cientistas, "antes cedo demais que tarde demais".

Didier Hochart, Senior UX Designer

Comment