O ChatGPT é um dos temas mais comentados em rodas de conversa de diferentes públicos – desde educação até profissionais de saúde –, uma vez que o impacto dele nos diferentes contextos têm sido amplamente discutidos. A ferramenta é a mais popular da OpenAI, companhia de capital fechado especializada em pesquisa e desenvolvimento na área de inteligência artificial fundada no final de 2015 por Sam Altman, Elon Musk e outros, a qual já captou 11 bilhões de dólares americanos, sendo 1 bilhão investidos pela Microsoft. 

De acordo com o Google Trends, ferramenta que mostra o interesse dos usuários segundo os termos de busca, temos um interesse crescente dos brasileiros no tema desde o início do ano conforme mostra o gráfico abaixo, onde o interesse é medido numa escala percentual variando de 0 a 100%.

Esse interesse não é só dos brasileiros, visto que o chat GPT atingiu índices recordes de adoção quando comparado com outras plataformas. Segundo dados da OpenAI, a marca de 1 milhão de usuários foi atingida em apenas cinco dias. A Statista, empresa internacional especializada em gerar análises baseadas em dados mundialmente, fez uma comparação dos tempos para atingir 1 milhão de usuários dos principais serviços digitais dos últimos anos

Observando o gráfico, notamos que o Instagram levou dois meses e meio para atingir a marca de 1 milhão de downloads, o que já era um feito incrível quando comparado com os outros serviços. Contudo, cinco dias é, sem sombra de dúvidas, a escala mais rápida da história no tocante à adoção de novos usuários! Vamos entender um pouco melhor o que aconteceu para que isso se tornasse possível? 

O ChatGPT, segundo autodescrição, é um modelo de linguagem de grande escala desenvolvido pela OpenAI e baseado na arquitetura GPT (Generative Pre-trained Transformer), que é um modelo de aprendizado de máquina de última geração que utiliza redes neurais profundas para gerar textos de forma autônoma. O ChatGPT se encaixa na categoria de large language models (LMM), que são modelos de redes neurais profundas capazes de interagir com o usuário em linguagem natural e realizar tarefas como responder questões e gerar textos ou imagens. Esses modelos são treinados com quantidades massivas de dados e possuem bilhões de parâmetros, o que eleva significativamente o custo de treinamento. Estima-se que os custos de treinamento do ChatGPT são da ordem de 4.6 milhões de dólares americanos.

Os modelos de aprendizagem de máquina que foram usados como base para a arquitetura GPT são chamados de “transformers” e foram propostos em 2017 no artigo “Attention is All You Need”, escrito por Ashish Vaswani e colaboradores, que faz menção indireta ao hit “All You Need is Love” dos Beatles. O paper já tem mais de 70 mil citações na data da publicação deste post, o que mostra o grande impacto desse trabalho.

Se os modelos baseados em transformers são conhecidos desde 2017, por que agora é que surgiu esse “Big Bang”? Além disso, será que somente a tecnologia por trás do modelo é a responsável por isso ou há alguma “sacada” por trás? Será que isso já aconteceu na história?

Sim, é claro! Vamos trazer dois exemplos icônicos onde temos semelhanças, dadas as devidas proporções! Geralmente, a empresa ou companhia que desenvolve uma tecnologia inovadora não é aquela que melhor gera valor a partir da invenção, o que permite que outras entidades venham e assumam o protagonismo.

O período do final dos anos 1970 e no início dos anos 1980 ficou marcado pelo crescimento de  empresas como a Apple, a IBM e a Microsoft, as quais estavam diretamente envolvidas num processo de revolução tecnológica que impactou a sociedade – o surgimento dos computadores pessoais (PCs). Entretanto, as primeiras versões dos PCs funcionavam em linha de comando em ambientes de terminal, cuja usabilidade era questionável, especialmente para usuários não especialistas. 

Um dos principais pontos de virada que potencializaram a adoção em massa foi o advento das interfaces gráficas de usuário, do inglês Graphic User Interface (GUI), as quais simplificaram o processo de utilização e de aprendizagem, permitindo que mais pessoas experimentassem, tornando-se usuárias dos PCs. 

Vocês se recordam qual das empresas a seguir – Apple, IBM ou Microsoft – criou o primeiro PC com GUI?

Crédito: living computers museum + labs

https://livingcomputers.org/Computer-Collection/Vintage-Computers/Minicomputers/XEROX-ALTO.aspx

A resposta certa é… a Xerox! Sim, a companhia que liderou o mercado de fotocopiadoras foi a responsável pelo primeiro PC com interface gráfica e com mouse, o Xerox Alto, criado em 1973, quase uma década antes do mercado bombar… vejam como isso é curioso! Inclusive, há um relato do Steve Jobs em vídeo onde ele afirma ter sido apresentado ao conceito de GUI em 1979, quando visitou o Centro de Pesquisas da Xerox na cidade de Palo Alto, Califórnia.

O Apple Macintosh, lançado em 1984, foi um dos primeiros computadores desenhados para o usuário comum da época, isto é, onde a interação do usuário com o dispositivo fosse intuitiva e sem a necessidade de utilizar massivamente o terminal de comandos. Estima-se que foram vendidas 1 milhão de unidades no período de 1984 a 1989, sendo esse número multiplicado por 10 nos cinco anos seguintes, o que era uma revolução naquela época. Desde então, todos os PCs seguiram esse caminho e, nessa linha, a Microsoft lançou o MS Windows, que cresceu rapidamente e ainda é o sistema operacional com maior fatia do mercado de computadores.

Outro fenômeno semelhante na história aconteceu em 2007, com o lançamento do iPhone, um marco para a plataforma de smartphones como conhecemos hoje. A Apple vinha em uma crescente após a inserção no mercado de música com o lançamento do iPod, tocador de músicas digital, e da iTunes, a loja de músicas digitais onde as faixas eram comercializadas individualmente e diretamente para o consumidor final, o que revolucionou o mercado musical na época.

Jobs anunciou o iPhone no evento de lançamento como a combinação de um iPod de tela grande, um telefone celular e um dispositivo conectado à internet com uma interface com usuário de toque, sem a necessidade de teclados físicos ou qualquer outro periférico como as canetas usadas para interagir com os palms, as agendas eletrônicas dos anos 2000.

O iPhone também gerou uma revolução no mercado de smartphones, levando 74 dias para atingir a marca de 1 milhão de unidades vendidas, gerando uma disrupção no mercado e  devastando empresas como a BlackBerry e a Nokia. Esse fenômeno foi bem descrito pelo Prof. Clayton Christensen como “O Dilema do Inovador”, o qual virou um best seller mundial na área de inovação e de negócios, e consolidou o termo “inovação disruptiva”.  

Christensen explica como empresas incumbentes podem ser superadas por concorrentes com produtos ou serviços inferiores, mas que oferecem uma solução mais conveniente, mais acessível ou mais simples. Isso acontece porque as líderes de mercado geralmente se concentram em melhorar seus produtos existentes para atender às demandas dos clientes atuais, enquanto os novos entrantes oferecem soluções inovadoras para satisfazer as necessidades de clientes negligenciados ou subestimados pelas empresas existentes. Em geral, novas tecnologias proporcionam essas novas oportunidades, criando essa ruptura no mercado e impactando fortemente o mercado das incumbentes.

Certo, mas como tudo isso se conecta com o ChatGPT?

Conforme descrito, os modelos baseados em transformers existem desde 2017 e a própria OpenAI tem feito experimentos com o modelo GPT3 desde 2020, segundo descrito no recente artigo A Survey of Large Language Models”, escrito por Wayne Xin Zhao e colaboradores,  que traz uma linha do tempo bem interessante dos últimos anos. 

O grande salto na adoção e na popularização veio na escolha de criar um chatbot onde os usuários podem interagir naturalmente com o modelo, sem qualquer complicação ou conhecimento prévio, exigindo somente que o mesmo seja capaz de ler e escrever. Isso é possível pois o GPT3.5, versão atualizada do GPT3 atualmente em utilização no ChatGPT, tem uma capacidade incrível de extrair informações de contexto, o que não era atingido pelas plataformas de chatbot convencionais.

Entretanto, a escolha acertada pelo modelo chatbot ainda ajuda a OpenAI a resolver um problema crítico para a evolução da plataforma, você sabia? Ao propor essa interface, os usuários conseguem facilmente dar feedbacks sobre as respostas, os quais são utilizados num processo de refinamento e aperfeiçoamento da plataforma! Ou seja, ao disponibilizar o ChatGPT em massa para o mundo, a OpenAI criou uma modalidade onde os usuários passam a ser contribuintes com o aprimoramento da plataforma, colhendo feedbacks e aprendendo em massa e em escala! 

Esse é um exemplo bem criativo de como uma empresa conciliou interesses distintos dos usuários e da própria companhia de um jeito inovador, simples e que está revolucionando o mundo. E aí, o que achou desse texto? Tem outros exemplos de sacadas como essa? Vai lá, comenta!

Fernando Sales é professor do Departamento de Engenharia Biomédica da UFPE e Pesquisador do Porto Digital

Comments are closed, but trackbacks and pingbacks are open.