Inteligência Artificial: um novo paradigma de interface do usuário (UI) em 60 anos

Jakob Nielsen

Jakob Nielsen
criado em 18/Junho/2023; traduzido em 01/07/25; versão PDF da página original AI_ First New UI Paradigm in 60 Years – NN_g;

Sumário: a inteligência artificial está introduzindo o terceiro paradigma de interface do usuário na história da computação, mudando para um novo mecanismo de interação onde os usuários dizem ao computador o que querem e não como fazê-lo – invertendo desta forma o centro de controle.


Este site é uma homenagem ao Grupo NNG, com tradução livre feita por mim a partir dos artigos produzidos no site oficial.
Este artigo foi traduzido a partir da página: AI: First New UI Paradigm in 60 Years

NN/g Nielsen Norman Group – https://www.nngroup.com

Chat GPT e outros sistemas de IA estão se configurando para lançar  o terceiro paradigma de interface do usuário na história da computação – um novo modelo de interação em mais de 60 anos.

Cursos Relacionados
Teste de usabilidade
Planejamento, condução, e análise dos seus próprios estudos, pessoalmente ou remotamente.
Pesquisa

Os 2 primeiros paradigmas

Paradigma 1: Processamento em lote

Desde o surgimento dos computadores, por volta de 1945, o primeiro paradigma de interface do usuário (UI) foi o processamento em lote. Neste paradigma, os usuários especificavam um fluxo de trabalho com tudo o que eles queriam que o computador realizasse. Este conjunto de instruções era submetido a um data center (geralmente como um maço de cartões perfurados) e o processamento ocorria em algum momento indefinido, frequentemente durante noite adentro.

Mais tarde, frequentemente na manhã seguinte, os usuários pegariam o resultado do seu lote: geralmente, isso seria uma pilha grossa de impressões em papel contínuo, mas poderia também ser um novo maço de cartões perfurados. Se o lote original contivesse até mesmo o menor erro, não haveria saída, ou o resultado seria sem sentido.

Da perspectiva da interface de usuário, o processamento em lote não envolvia qualquer interação entre o usuário e o computador. A interface do usuário era um único ponto de contato: aquele lote de cartões perfurados. A usabilidade era péssima e era comum a necessidade de muitos dias para ajustar o lote até que sua execução produzisse o resultado desejado.

Paradigma 2: Design de interação baseado em comandos

Por volta de 1964, com o surgimento do compartilhamento de tempo (time-sharing – onde vários usuários compartilhavam um único computador central (mainframe) através de terminais conectados) resultou um segundo paradigma de interface do usuário: a interação baseada em comandos. Neste paradigma, o usuário e o computador se revezam em um comando por vês. Este paradigma é tão poderoso que tem dominado a computação desde então – há mais de 60 anos.

Interação baseada em comandos tem sido a abordagem implícita ao longo de 3 gerações de tecnologia de interface do usuário: linhas de comando (como DOS ou Unix), terminais de texto em tela cheia (comuns em mainframes da IBM) e interfaces gráficas de usuário (em inglês) (GUI: Macintosh, Windows e todas atuais plataformas de smartphones). Estas são poderosas e duradoras de fato.

O benefício das interações baseadas em comandos em comparação com o processamento em lote é claro: depois que cada comando foi executado, o usuário pode reavaliar a situação e modificar comandos futuros para avançar em direção ao objetivo desejado.

Na verdade, os usuários nem precisam ter um objetivo completamente definido em mente porque eles podem ajustar sua abordagem ao problema conforme obtêm mais informações do computador e veem os resultados dos seus comandos iniciais (ao menos, esse é o caso se o design seguir a primeira das 10 heurísticas de usabilidade (em inglês): visibilidade do estado do sistema). Os primeiros sistemas de linha de comando geralmente não mostravam o estado atual do sistema, resultando em uma terrível usabilidade. Por exemplo, em Unix, nenhuma notícia era uma boa notícia porque você só receberia algum retorno do computador se o seu comando resultasse em uma mensagem de erro. Não ter erros significava ausência de informação do computador sobre o novo estado do sistema, o que dificultava para usuários compor o comando seguinte.

A beleza das interfaces gráficas de usuários é que elas mostram o estado do sistema após cada comando, ao menos que são bem projetadas. A interface gráfica de usuário tem dominado o mundo da experiência do usuário (UX) desde o lançamento do Macintosh em 1984: cerca de 40 anos de supremacia até que seja possivelmente substituída pela próxima geração de tecnologia de interface de usuário e, mais importante, o próximo paradigma da interface do usuário na forma de inteligência artificial.

O novo paradigma

Paradigma 3: Especificação de Resultados Baseada em Intenção

Eu duvido que o atual conjunto de ferramentas de inteligência artificial generativa (como ChatGPT, Bard, etc) represente as interfaces de usuário que utilizaremos daqui a alguns anos, porque elas apresentam problemas profundos de usabilidade. Esses problemas levam ao surgimento de um novo papel – o “engenheiro de prompt”. Os  engenheiros de prompt existem para provocar o ChatGPT da maneira certa, fazendo com que ele forneça os resultados desejados.

Este novo cargo me lembra quando precisávamos de especialistas em consultas devidamente treinados para pesquisar através de extensos bancos de dados de pesquisas médicas ou casos jurídicos. Então veio o Google e qualquer começou a poder pesquisar. O mesmo salto no nível de usabilidade é necessário com essas novas ferramentas: uma melhor usabilidade na inteligência artificial pode significar uma vantagem competitiva (e se você está considerando se tornar um engenheiro de prompt, não conte com uma carreira duradoura).

O atual estilo de interação via chat também sofre ao exigir que usuários escrevam seus problemas em forma de texto corrido. Com base na literatura recente, considero provável que metade da população em países desenvolvidos não são articuladas (em inglês) o suficiente para obter bons resultados de um robô (bot) de inteligência artificial atual.

Dito isso, a interface de usuário baseada em inteligência artificial representa um diferente paradigma na interação entre humanos e computadores – um paradigma que traz muito potencial.

Conforme mencionado, nas interações via comando, o usuário emite comandos para o computador,  um por vez, produzindo gradualmente o resultado desejado (se o design tiver usabilidade suficiente para permitir que as pessoas entendam quais comandos emitir em cada etapa). O computador é completamente obediente e reproduz exatamente o que foi solicitado. O lado negativo é que a baixa usabilidade geralmente leva os usuários a formular comandos que fazem algo diferente do que eles realmente desejam.

Com os novos sistemas de inteligência artificial, o usuário não diz mais ao computador o que precisa fazer. Em vez isso, o usuário informa ao computador o que espera como resultado. Desta forma, o terceiro paradigma de interface do usuário, representado pela atual IA generativa, é a especificação de resultado baseada em intenção.

Um exemplo simples de prompt para um sistema de inteligência artificial é:

Me faça um desenho adequado para a capa de uma revista Pulp de ficção científica, mostrando um vaqueiro (cowboy) com traje espacial em um planeta sem ar, com duas luas vermelhas no céu.

Tente pedir ao Photoshop (de 2021) para fazer isso! Naquela época, você teria que emitir centenas de comandos para criar a ilustração gradualmente. Nos dias atuais, Bing Image Creator retorna 4 sugestões de imagens em apenas alguns segundos.

Imagem criada através do Bing Image Creator com o prompt: "Me faça um desenho adequado para a capa de uma revista Pulp de ficção científica, mostrando um vaqueiro (cowboy) com traje espacial em um planeta sem ar, com duas luas vermelhas no céu."
Imagem criada através do Bing Image Creator com o prompt: “Me faça um desenho adequado para a capa de uma revista Pulp de ficção científica, mostrando um vaqueiro (cowboy) com traje espacial em um planeta sem ar, com duas luas vermelhas no céu.

Com este novo paradigma de interface do usuário (UI), representado pela atual inteligência artificial generativa, o usuários informa ao computador o resultado desejado mas não define como este resultado deve ser alcançado. Em comparação com a tradicional interação baseada em comandos, este paradigma inverte completamente o local (ou fonte) de controle. Eu até questiono se deveríamos descrever este paradigma de experiência do usuário como uma interação, porque não há alternância de turnos ou processo gradual.

Dito isso, em meu exemplo de ilustração de ficção científica, ainda não estou feliz com os trajes espaciais. Isso talvez possa ser corrigido com um novos comandos na inteligência artificial. Cada rodada de refinamento gradual é uma forma de interação que atualmente é pouco suportada, oferecendo grandes oportunidades de melhoria na usabilidade, para aqueles fornecedores de inteligência artificial que se preocupam em fazer pesquisa de usuário, descobrirem melhores maneiras de permitir com que pessoas comuns controlem seus sistemas.

Faça o que eu quero, não faça o que eu digo é um sedutor paradigma de interface de usuário – como mencionado, os usuários frequentemente ordenam ao computador para que faça a coisa errada. Por outro lado, atribuir totalmente o lugar de controle tem desvantagens, especialmente com a atual inteligência artificial, a qual tende incluir informações erradas nos seus resultados. Quando usuários não sabem como algo foi feito (em inglês), pode ser mais difícil para eles identificar ou corrigir o problema.

O paradigma baseado em intenção não chega ao nível dos sistemas sem comandos (nocommand systems), o que eu introduzi em 1993. Um verdadeiro sistema sem comandos não exige que o usuário especifique sua intenção, pois o computador age como efeito colateral das ações normais do usuário.

Como exemplo, considere destrancar um carro puxando a maçaneta da porta: esse é um desbloqueio sem comando porque o usuário vai executar a mesma ação independentemente do carro estar trancado ou aberto. (por outro lado, um carro operado por reconhecimento de voz não poderia destrancar a porque o usuário disse: “Eu quero que o carro esteja destrancado”, o que seria uma  especificação de resultado baseada na intenção. E um carro antigo poderia ser operado por um comando explicito de destrancar uma porta inserindo e girando uma chave).

Ainda não está claro se sistemas de inteligência artificial podem alcançar alta usabilidade dentro do paradigma de especificação de resultado baseada em intenção. Eu duvido disso porque eu sou um fã entusiasta de interfaces gráficas de usuário. Informação visual é frequentemente mais fácil de entender e mais rápida de interagir do que texto. Você conseguiria preencher um formulário longo (como uma solicitação de conta bancária ou uma reserva de hotel) conversando com um chatbot — mesmo um tão inteligente quanto as novas ferramentas de IA generativa?!

Clicar ou tocar em elementos em uma tela é um aspecto intuitivo e essencial da interação do usuário que não deve ser ignorado. Desta forma, o segundo paradigma de interface do usuário sobreviverá, embora em um papel menos dominante. Sistemas futuros de inteligência artificial provavelmente terão uma interface de usuário híbrida que combina elementos de ambas interfaces, baseada em intenção e baseada em comandos, enquanto ainda mantém muitos elementos de interfaces gráficas de usuário (GUI).

Saiba Mais

Prototipagem assistida po IA: promessas e armadilhas (em inglês)
Megan Brown
 · 5 min

Cuidado: estrutura para elaborar prompts de IA (em inglês)
Kate Moran
· 4 min

Usuários sintéticos: “participantes” de IA (em inglês)
Kara Moran
· 4 min

Artigos relacionados:

Cuidado: estrutura para elaborar prompts de IA (em inglês)
Kate Moran · 4 min

IA como assistente de UX (em inglês)
Feifei Liu, Mingjin Zhang e Raluca Budiu · 18 min


Publicado

em

por

Tags: