Desigualdades de Renda – Uso do Big Data

Postado em 10 de fevereiro de 2022   artigos

O Big Data é para minha empresa?

Dos termos contemporâneos de gestão, “Big Data” é daqueles que geram uma espécie de euforia em muitos e desconfiança em tantos outros. O site da Oracle[1] define big data como: “dados obtidos em grande volume, velocidade e variedade”. Exemplos sempre citados desse tipo de dado são os comentários e interações em redes sociais (curtidas, compartilhamentos, e etc.), o que nos parece correto, claro. Afinal, são dados que podem ser obtidos de forma rápida, com o software apropriado, são gerados em grande velocidade e, dependendo do recorte de análise, representam um volume imenso a ser analisado.

Vamos para um exemplo bem mais simples de busca e análise dos dados: você provavelmente já abriu um o Google Maps e buscou um determinado tipo de estabelecimento: restaurante, estacionamento, mercado, etc. Uma pesquisa coordenada por um dos sócios da Stadiumetric, também professor universitário, Rodolfo Ribeiro, sistematizou uma busca dessa para levantar estabelecimentos cadastrados como pizzaria em São Paulo. Na explicação metodológica, o resumo feito por Rodolfo é assim:

“imagine abrir um mapa do Google em uma determinada coordenada e digitar “pizza”. O Google fornecerá uma lista de estabelecimentos que se enquadram nessa descrição. A pesquisa que elaborou um Índice Mozarela, divulgada em alguns veículos como o Valor Econômico[2] e a Folha de São Paulo[3] faz exatamente isso. Porém, em vez de abrir o mapa e fazer isso manualmente, a busca realizada utiliza uma API com o Google Maps e traz mais de 5 mil estabelecimentos em poucos segundos. Olha o volume e a velocidade do Big Data aí. E toda essa captura de dados foi muito barata, praticamente gratuita. Claro que desse “muito barata”, nós estamos descontando todo o conhecimento acumulado necessário para desenvolver a busca por meio da API”.

Que tipo de análise foi realizada após a coleta dos dados?

Com os dados dos estabelecimentos coletados (nome do estabelecimento, endereço, estrelas de avaliação pelo Google e outras informações), foi iniciada a coleta de preços do produto mais básico oferecido pelas pizzarias: a pizza de mozarela. Nessa etapa também poderia ser feita uma automatização da busca, fazendo uma varredura de páginas de internet, por exemplo.

Para colher o preço da forma mais próxima possível do que é a realidade, o estudo coletou os preços entrando em contato diretamente com os estabelecimentos. Feita a coleta de dados, o poder de compra de cada distrito da cidade foi calculado seguindo o seguinte princípio: quanto o preço médio de um determinado distrito representa da renda familiar média daquele distrito, de acordo com a fórmula abaixo:

Em um gráfico de dispersão, onde se analisar o Índice Mozarela de cada distrito e a sua respectiva renda familiar, essa relação é bastante evidente, conforme gráfico abaixo.

A renda familiar utilizada de cada distrito foi a divulgada pela Rede Nossa São Paulo[4]. Os dados explorados visualmente, na geografia da capital, revelam que as periferias da cidade (zonas mais afastadas do centro) pagam mais caro quando se considera o índice, conforme consolidação realizada posteriormente pelo jornal Folha de São Paulo[5].

Até a próxima!

 

 

[1] https://www.oracle.com/br/big-data/what-is-big-data/#:~:text=A%20defini%C3%A7%C3%A3o%20de%20big%20data,de%20novas%20fontes%20de%20dados.

[2] https://valor.globo.com/brasil/noticia/2022/01/28/indice-mozarela-compara-preco-da-pizza-e-revela-desigualdade-em-sp-veja-quanto-custa-no-seu-bairro.ghtml

[3] https://www1.folha.uol.com.br/blogs/cozinha-bruta/2022/01/sao-paulo-numa-pizza-de-mucarela.shtml

[4] https://www.nossasaopaulo.org.br/

[5] https://www1.folha.uol.com.br/mercado/2022/02/pizza-consome-mais-a-renda-das-periferias-de-sao-paulo.shtml