Árvore de Modelos – Público do Brasileirão 2019

Postado em 27 de abril de 2020   artigos

O que aconteceu com o público no Brasileirão?

Nos últimos anos, houve uma percepção (correta, sem dúvida) de que houve um aumento de público no Campeonato Brasileiro da Série A. A edição de 2019 foi a de segundo maior público pagante, atrás somente da edição de 1983, de acordo com o jornalista Juca Kfouri[1].

Segundo dados do disponíveis no site do Globo Esporte[2], o público pagante médio do do Campeonato Brasileiro de Futebol da Séria A evoluiu da seguinte forma entre 2015 e 2019:

A diferença/ ∆público pagante entre o ano de menor público na série (edição de 2016) e o de maior público (edição de 2019) é bastante representativa: +39%.

Como poderíamos explicar tal variação? O formato de pontos corridos finalmente “pegou”; os ingressos ficaram mais baratos; ou isso se deve à uma variação aleatória?

Há diversos trabalhos que analisam a composição do público em campeonatos como o Brasileirão. O trabalho de Benevides et al (2015)[3] traz uma análise bastante ampla da formação de público no campeonato brasileiro. Os autores, assim como em outros trabalhos, utilizam um modelo de regressão (metodologia já exposta em outros artigos da Stadiumetric) para explicar a variação do público nos jogos.

A demanda do campeonato é a soma das demandas de cada clube. Portanto, para compreender a variação do público total do campeonato, uma abordagem possível é a soma das demandas individuais (de cada clube), uma vez que cada clube possui torcidas de diferentes tamanhos.

Quantos modelos devemos analisar?

Coletamos os dados de público e renda, jogo a jogo, entre as edições de 2015 e 2019 do Campeonato Brasileiro da Série A. Em vez de analisarmos os dados através de um modelo único, nós decidimos aplicar uma lógica de “Árvores de Modelos”. Uma Árvore de Modelos é similar à Árvores de Decisão, porém a cada “nó”[4], representado por uma condição, um novo modelo é gerado, atendendo às condições dos “nós” anteriores. Abaixo trazemos um representação gráfica da abordagem lógica utilizada:

Tal representação nos diz que, para jogos ocorridos quando um clube está entre 1° e 4° lugares na tabela, há duas respostas possíveis em relação ao preço: quando o jogo é um clássico e outra quando o jogo não é clássico. E, para jogos ocorridos quando o clube está entre a 5° a 20° posições, a resposta tende a ser a mesma, independente de adversário. Essa é uma representação apenas para compreensão de como são analisadas árvores de modelos.

O mais importante nisso é: são os dados que dizem quantas “quebras” devemos ter. Ao tomar decisões, devemos levar em considerações as informações e relações sugeridas pelos modelos e, enfim, decidir. Apesar de haver sempre uma decisão “ótima” com base em modelagens desse tipo, inputs qualitativos podem ser usados para decisões pontuais.

Afinal, o que aconteceu com o público no campeonato brasileiro?

Analisamos um total de 1900 jogos (entre 2015 e 2019: 380 jogos x 5 edições). Para que o leitor tenha uma ideia da heterogeneidade dos dados, há jogos com público com apenas 338 pagantes (Atlético-GO vs Sport-PE, disputado na edição de 2017), ao mesmo tempo que há jogos com 67.011 pagantes (CR Flamengo vs Coritiba FC, disputado na edição de 2015).

Nossa solução de análise final envolveu 20 modelos diferentes, que consolidados geraram os seguintes resultados:

Como de pode ver nos dados, os público projetados somadas a cada jogo apresentam altíssima aderência ao público observado de cada edição do Campeonato Brasileiro da Série A. No total, foram utilizadas 341 variáveis para explicar a variação de público do campeonato.

Alguns “spoilers” de nossa análise:

  • A edição de 2019 do Campeonato Brasileiro da Série A não teve público elevado apenas porque o CR Flamengo foi campeão, e sim pela quantidade de jogos que esse mesmo clube fez com demanda potencialmente alta;
  • alguns eventos não recorrentes, como transferência de mando de jogo por clubes pequenos (ex: Avaí FC vs. CR Flamengo disputado no Mané Garrincha), têm importância significativa no efeito total combinado observado.

Complementarmente aos pontos acima, a Árvore de Modelos construída pode auxiliar na elaboração de ações administrativas e operacionais que contribuam ao aumento contínuo do público pagante no Campeonato Brasileiro da Série A. Dentre as ações que estão na esfera de responsabilidade da CBF, nós podemos destacar:

  1. realização das partidas em horários favoráveis a n° de pagantes no estádio;
  2. realização das partidas em dias favoráveis a n° de pagantes no estádio;
  3. realização das partidas em Arenas/ Estádios favoráveis a quantidade de público;
  4. definição de critérios esportivos para a transferência programa de mando.

Os itens 1 & 2 remetem à uma melhor organização da tabela do Campeonato Brasileiro.

Embora a melhor organização de dias e horários já seja amplamente debatido, é importante frisar que a Árvore de Modelos indica que há idiossincrasias regionais – horários mais favoráveis a público na Região Sul e Sudeste não são os mesmos observados nas Regiões Centro-Oeste e Nordeste. Ou seja, a Árvore de Modelos auxilia a CBF em resolver a questão de forma segmentada e respeitando as regionalidades.

Os itens 3 & 4 são intrínsecos. A adoção de maior pragmatismo a transferência programa de mando, possibilita:

  • clubes com capilaridade nacional de torcida a atender a demanda reprimida em diversas praças nacionais;
  • clubes de menor porte, obterem receitas extraordinárias que reduza déficit orçamentário em relação aos gigantes nacionais.

Ao adotar-se critérios objetivos para operacionalização dos itens 3&4, eventuais insatisfação dos torcedores tendem a serem mitigadas.

Há ainda um 5° item em nossa análise: Maior Competitividade entre as equipes.

Embora o maior grau de disputa entre os postulantes não esteja sob controle da CBF, a ela repousa a responsabilidade de criar as condições institucionais necessárias para que tenhamos o máximo de postulantes ao título, brigando rodada a rodada, a cada edição do Brasileirão.

Desta forma, ao torcedor seria oferecido, a cada semana, 2 ou 3 jogos com apelo de “Final de Campeonato”. A volta dos “Mata-Matas” é revisitada em discussões esportivas ao final de cada rodada, em especial quando há público aquém do esperado.

Ou seja, mais importante do que discutir a volta ou não dos “Mata-Mata” é necessário diminuir o índice de Herfindahl do Campeonato Brasileiro de Futebol (teoria abordada no artigo: Índice de Competitividade – Brasileirão vs. Ligas Europeias).

 

Até a próxima!

 

 

[1] https://blogdojuca.uol.com.br/2019/12/a-ultima-impressao-e-a-que-fica/

[2] http://app.globoesporte.globo.com/futebol/publico-no-brasil/2019/index.html

[3] Benevides, B.I.L.; Santos, S.M.; Cabral, A.C.A.; Ribeiro, R.A.; Holt, N.L.S. (2015). Demanda por Futebol no Brasil e na Inglaterra. Revista Pensamento Contemporâneo em Administração, v(2), 96-112.

[4] Lantz, B. (2013). Machine Learning with R. Packt Publishing