Amos Tversky e Daniel Kahneman são dois psicólogos israelenses que estudaram a fundo os processos de tomada de decisão, especialmente, no contexto econômico. A área de economia comportamental cresceu com o desenvolvimento dessas pesquisas que questionam as premissas da base de diversas teorias econômicas: os seres humanos tomam decisões racionais. Kahneman foi premiado com o Prêmio Nobel de Economia em 2002.

Um teste famoso dos pesquisadores é conhecido como o experimento da bancária, onde eles apresentaram o seguinte caso aos participantes do estudo: 

Linda, que é solteira, inteligente, e muito envolvida com questões de justiça social e discriminação. Em seguida, os participantes são questionados sobre qual das seguintes opções é mais provável:

Linda é uma bancária.

Linda é uma bancária e está ativa no movimento feminista.

De forma surpreendente, um número significativo de participantes escolhe a segunda opção como sendo a mais provável, apesar de ser matematicamente impossível que Linda seja mais provável de ser uma bancária e estar ativa no movimento feminista do que simplesmente ser uma bancária. A segunda opção é um subconjunto da primeira, o que significa que não pode ser mais provável sob nenhuma circunstância.

decisões baseadas em dados

Esse resultado foi interpretado como um exemplo do viés de representatividade. As pessoas tendem a julgar a probabilidade de um evento com base na similaridade entre o evento e um protótipo ou estereótipo, em vez de utilizar raciocínio estatístico. No caso do experimento da “bancária”, os participantes parecem pensar que a descrição de Linda é mais “representativa” de uma bancária que é também feminista do que simplesmente uma bancária, apesar das regras básicas da probabilidade dizerem o contrário.

O hábito libertador de só ter opiniões baseadas em dados

Hans Rosling, um médico sueco que passou a vida dedicando-se à pesquisa em saúde pública, realizou uma série de estudos onde concluiu que a maior parte das pessoas do mundo possuem uma má concepção sobre uma série de questões ordinárias relacionadas a dados do cotidiano. É como se estivéssemos com uma percepção distorcida da realidade, baseada em crenças pré-estabelecidas ou em percepções desatualizadas, que estão alinhadas ao viés de representativamente de Tversky e Kahneman. 
Hans mostra isso na palestra “How to not be ignorant about the world” no evento TEDSalon Berlin em 2014 Talk, cujo vídeo encontra-se abaixo:

Rosling faz perguntas à audiência sobre estatísticas globais de saúde, população e renda, mostrando que a percepção média da audiência está abaixo do esperado. Visando combater esse problema, fundou com outros colaboradores a Fundação Gapminder, para disseminar conhecimento através de uma visão baseada em fatos. Para tal, a fundação desenvolveu uma série de estudos, ferramentas e visualizações de dados para conscientizar as pessoas sobre a importância das evidências. Um dos gráficos mais famosos está disponível a seguir e mostra a evolução da expectativa de vida e do PIB per capita desde 1800 no mundo. Cada país é representado como uma bolha, sendo o tamanho proporcional à população e a cor correspondente ao continente.

Podemos verificar na animação acima que, ao longo dos últimos 200 anos, a expectativa de vida da população mundial quase dobrou na média e a quantidade de riqueza aumentou significativamente, apesar da dispersão ter aumentado bastante entre os países. Há uma série de insights interessantes que podem ser extraídos dessa animação e de tantas outras produzidas por Hans e seus parceiros. Hans descreve essa trajetória no livro “Factfulness: O hábito libertador de só ter opiniões baseadas em fatos”, que se tornou um best seller global. 

Como essas histórias se conectam com o nosso cotidiano?

Nas jornadas de inovação, vejo uma série de bons empreendedores, imbuídos de propósito e convicção em seus empreendimentos, sem evidências robustas ou com narrativas inconsistentes. Frequentemente, aparecem argumentos baseados em expectativas futuras ou em sentimentos pessoais que dificilmente tem potencial de convencimento amplo. 

Em algumas situações, apresentar informações especializadas é crucial no processo de convencimento e, acreditem, isso pode não ser tão complicado como parece. Há uma série de bases de dados abertas para consulta e que podem nos ajudar no processo de argumentação. Iremos mostrar algumas opções disponíveis que podem ser bem úteis em uma série de contextos.

decisões baseadas em dados

Nesse contexto, gostaria de destacar o portal “Base dos Dados” que congrega referências para mais de 1.100 bases de dados abertas e possuem também mais de 120 bases tratadas. Ou seja, a equipe do projeto faz um trabalho de extração, transformação e carga dos dados para repositórios no Google Cloud, facilitando o consumo por usuários interessados. 

Para tal, basta fazer uma conta no portal e acessar os dados usando algumas linguagens como: SQL, R, Python ou Stata. Muitas das bases de dados disponíveis são provenientes de órgãos públicos, majoritariamente, da esfera federal, o que nos possibilita traçar diferentes panoramas do mercado. 

Por exemplo, consideremos o caso de uma startup do mercado de saúde que pretende oferecer uma solução de software no contexto de gestão de manutenção de equipamentos médicos e deseja caracterizar o tamanho de mercado do produto em questão. Primeiramente, é possível identificar os estabelecimentos de saúde do país através do Cadastro Nacional de Estabelecimentos de Saúde (CNES) do Ministério da Saúde. Nessa base, é possível estratificar por localidade, por modalidade administrativa, a quantidade de leitos e, inclusive, quais possuem serviço de manutenção próprio ou terceirizado. Adicionalmente, é possível também identificar quantos profissionais cada hospital tem, segmentando os mesmos pela ocupação, a partir do código da Classificação Brasileira de Ocupações (CBO).

Além disso, é possível identificar em bases de dados da Relação Anual de Informações Sociais (RAIS) a quantidade de empresas por ramo de atividade econômica e segmentar aquelas voltadas para atividades de manutenção de equipamentos médicos por localidade, o que permite identificar, por exemplo, onde há maior oferta de serviços de manutenção de equipamentos.
Enfim, com o modelo acima, é possível definir os quantitativos descritos com pequeno esforço, uma vez que muitos dos dados descritos já foram tratados pela equipe da plataforma “Base dos Dados”. Além disso, é possível utilizar o chatGPT para gerar códigos de consultas como script a seguir:

decisões baseadas em dados

Compilando a query (consulta) dos estabelecimentos, podemos exportar os dados para o Google Sheets e fazer o gráfico a seguir no Looker Studio:

Com base nos dados, em torno de 45% dos estabelecimentos está no Sudeste, seguido pelas regiões Sul e Nordeste que têm, respectivamente, 22% e 20% do total e, no final, temos o Centro-Oeste e o Norte com 8% e 5% dos estabelecimentos nacionais. Ou seja, nas regiões sul e sudeste temos dois terços do quantitativo nacional. A partir dessa exploração, podemos complementar a análise com outras informações para seguirmos na caracterização do tamanho do mercado em questão e ir construindo a narrativa a partir dos fatos observados. 

Por exemplo, se buscarmos na base da RAIS as empresas de manutenção de equipamentos médicos a partir do CNAE, podemos estimar o quantitativo de empresas por estado. Observe que os dados da RAIS disponíveis no “Base dos Dados” é de 2021, mas segue para realizarmos essa análise. Os gráficos estão em um painel interativo, onde você pode interagir clicando nos ícones dos estados ou na tabela, inclusive mudando a visualização de estado para região através da pequena seta disponível no topo da tabela.

Observamos que a concentração de empresas de manutenção de equipamentos médicos acompanha a quantidade de estabelecimentos quando olhamos por região. Contudo, se criarmos um índice de empresas por mil estabelecimentos, verificamos que há uma mudança no quadro, especialmente quando olhamos para esse indicador por estado. O Distrito Federal lidera o ranking, seguido por SP, RJ, PR e GO, respectivamente, o que coloca o Centro-Oeste na segunda posição, atrás do Sudeste, e à frente das regiões Sul, Nordeste e Norte, respectivamente. 

Com essa breve demonstração, conseguimos trazer dados preliminares sobre o cenário do mercado de manutenção de equipamentos médicos como um exemplo de como podemos utilizar dados abertos para criar narrativas baseadas em fatos. É evidente que, à medida que vamos analisando os dados, surgem novas perguntas, o que nos leva a mergulhar mais fundo no contexto e buscar novas fontes.

Dessa forma, é importante basearmos nossas narrativas em fatos sempre, afinal, se dependermos do senso comum das pessoas, podemos cair também no viés de representatividade apresentado anteriormente. Por isso, é fundamental trazer evidências, visando nivelar o entendimento de todas as partes interessadas e maximizar o potencial de convencimento das mesmas.

Você sabia que a equipe do Núcleo de Gestão do Porto Digital tem usado dados para analisar cenários e planejar ações estratégicas a partir de estudos? Um caso interessante é o do Festival REC‘n’Play, que está sendo redesenhado a partir de análises de dados coletados no ano passado. Quer saber mais sobre isso? Se inscreva no evento “A força dos ecossistemas em eventos de inovação”, que acontece na terça-feira (05 de setembro), no CESAR.

Fernando Sales é professor do Departamento de Engenharia Biomédica da UFPE e pesquisador do Porto Digital

Comments are closed, but trackbacks and pingbacks are open.