Skip to content

Latest commit

 

History

History
142 lines (111 loc) · 10.5 KB

mrktng_anlzng_02.md

File metadata and controls

142 lines (111 loc) · 10.5 KB
PROJETO OBJETIVO TIPO DE DADOS
Marketing Analytics do Zero Aplicar estatística descritiva, Análise de Regressão e Modelos básicos de Séries Temporais Time Series
LinkedIn : https://www.linkedin.com/in/claudineien/

AULA 2 - ANÁLISE DESCRITIVA I

DATASET VENDAS CHOCOLATE

Utilizaremos o dataset BD_marcas_de_chocolate.csv ou BD_marcas_de_chocolate.xlsx com dados agregados de todas as informações consolidadas das vendas de determinadas marcas de chocolate de todas as lojas de uma grande rede de varejo dentro de um período de 104 semanas, aproximadamente dois anos.

Estes dados se caracterizam como Time Series (Serie Temporal) por que ocorrem dentro de um determinado tempo, prazo controlado por semana.

Modelos inferenciais são modelos de dependência como por exemplo análise de regressão. Nestes há variáveis que são dependentes/respostas de variáveis independentes/explicativas.
Por exemplo : A variável Vendas_Budget é a variável dependente/resposta, que depende das outras variáveis independentes/explicativas que explicam o seu resultado.

Serão gerados estatísticas descritivas no software Gretl.

Uma das habilidades necessárias que precisamos desenvolver na estatística é saber apresentar os dados. Exibir as informações mais relevantes que trazem valor a organização.

A decisão do gestão de marketing geralmente se baseia no curto prazo, se o resultado foi negativo entre quatro e seis semanas após sua decisão uma nova decisão será aplicada.

O dataset será segmentado ano a ano para identificar como as estratégias de marketing variaram entre os anos. Analisaremos :

  1. preço atual, anúncio, display, anúncio de display
  2. variáveis de resposta : situação de venda, participação de mercado e receita

As respostas que vão guiar o modelo inferencial estão nos nuances/na sutileza da estatística descritiva.

O comportamento descritivo quando segmentado condicionando a determinadas características ele balisa/demarca/sinaliza o modelo inferencial que será desenvolvido.

Dica : As estatísticas descritivas nos informa o que esta acontecendo, não precisa executar regressão.


ANÁLISE DESCRITIVA

1o momento da estatística é a centralidade (média, mediana). A média é considerada uma nova observação podendo ter o poder de substituir todos os outros valores se a variável for simétrica e sua variabilidade for baixa.
Por exemplo :
Duas lojas em bairros diferentes
1a loja 500 mil/mês com desvio-padrão de 50 mil/mes
2a loja 500 mil/mês com desvio-padrão de 350 mil/mes
Análise :
As vendas de ambas as lojas são em média equivalentes, porém as vendas da loja 1 variam mais por algum motivo.
Para se ter uma média equivalente a 1a loja vende sempre próximo a 500mil/mes enquanto a 2a loja possivelmente vende 10mil em determinado mês, 300mil em outro mes, 750mil/mes e assim por diante.
É necessário identificar o motivo da variação da 2a loja

Mediana é uma medida de centralidade mas encadeamos todos os 104 valores de preço da marca budget do menor ao maior se a quantidade de observações for ímpar considera-se o valor do meio, se a quantidade for par considera-se os dois mais centrais e calcula a média aritmética.

2o momento na estatística é a variabilidade ou distância

Ao gerar a média é possível calcular a distância de cada observação de preço em relação a média

Preco_atual_Budget
Gerar gráfico de distribuição de frequência
Uma barra de distribuição no início e uma barra de distribuição no final, entre elas há um grande intervalo sem barra alguma. Isto significa que a marca quase não varia o preço.
Possivelmente é uma marca de combate, uma marca marginal que tem sempre uma participação X e sempre pratica o mesmo preço, raramente faz promoção.
As vezes há a marca premium com práticas estratégicas interessantes e tem a marca de combate que tem o preço muito baixo cujo preço raramente é alterado e possui o seu mercado. Isto já estava expresso nas variáveis de variabilidade e pode ser percebido pelo desvio padrão do preço é quase zero, isto significa que preço quase não varia.
Observar que o desvio-padrão é quase zero, que significa que não houve variação no preço do produto.

Utilizar o documento 01-Report_Descritivo.docx como apoio para analisar as média, mediana, desvio-padrão, coeficiente de variação, no primeiro ano e no segundo ano por marca e extrair informações.

Anotar todos os valores de todas as marcas nas 52 semanas para cada ano, aonde as variáveis de preço variam ao longo do tempo e dependendem de alguns acontecimentos. É possível detectar :
Marca Budget
Analisando a variação das estratégias em dois anos, identificamos que a marca budget possivelmente é uma marca de combate por que :
1. comparando com as outras marcas : o valor da média é a mais inferior, o desvio-padrão esta zerado, o coeficiente de variação é o mais baixo
2. comparando entre os anos : o preço cobrado é o mesmo nos dois anos, a media = mediana com desvio padrão 0 no segundo ano
Marca Cadbury
Foi a lider de preço no primeiro ano, e lider de preço no segundo ano com outras duas marcas. Possivelmente esta relacionado ao desvio padrão que no primeiro ano foi menor que as demais e no segundo ano foi maior e/ou ao coeficiente de variação que no primeiro ano foi bem maior que as demais e igualou ou ficou com distância bem menor no segundo ano.

Atenção :

- A maioria das técnicas, das mais simples as mais complexas em estatísticas trabalham com dois conceitos básicos que é centralidade e variabilidade/distância.
Por exemplo : Análise de agrupamento que não é análise de dependência aonde trabalhamos análise fatorial, cluster vamos concentrar coisas parecidas e separar de coisas não parecidas.
Regressão por meio de mínimos quadrados ordinários ols, regressão linear para saber o ajuste do modelo então vamos trabalhar a distância das observações em relação a reta de regressão.

- Mediana = Moda = Média -> é simetria. A curva é normal em forma de sino.

- Clusterização em Estatística é tornar homogêneo o conteúdo interno e heterogêneo os conteúdos entre os clusters para garantir maior variabilidade entre os clusters e minimizar a variabilidade dentro dos clusters.

- Mercado : conjunto de compradores reais e potenciais

- Desvio padrão : Medida de distância padronizada
Suponha uma turma de alunos com média de idade de vinte anos, a distancia de certa idade em relação média é de +2 a distância de outra certa idade é de -2.
Se eu somar todas as distâncias e o resultado for 0, utilizaremos uma regra matemática para extrair a variabilidade conhecida como variância.

- O desvio padrão é a raiz quadrada da variância, por que para gerar a distância deve-se elevar ao quadrado. Por exemplo o salário elevado ao quadrado em relação a média é superinflacionando/superestimando o salário, então deve-se voltar o salário como uma medida de variabilidade em relação a média deve-se extrair a raiz quadrada sobre o salário.

- Informação importante a extrair em modelos estatísticos, principalmente em time series é detectar se a variação da variável em relação a média é constante ou não.

- As técnicas da variância são aplicadas em variáveis quantitativas como venda, preço, salário. A variável qualitativa em fator é em proporção.

- O coeficiente de variação (cv) é a medida padronizada de quanto o desvio padrão da variável varia em relação a média multiplicado por 100.
O coeficiente de variação significa que a variação em relação a média do preço atual da budget é 0.0083335%

- Estatisticamente em geral se c.v. < 25% é homogêneo se maior é heterogêneo. Deve-se ficar atento por que esta regra pode mudar de acordo com a natureza da varíavel.

- A estatistica é uma área que se utiliza de diversas medidas de padronizadas para obter resultados.
Por exemplo o z-score, a correlação (padronizada em -1 e 1) por que a covariância (mãe da correlação) não é. Estas padronizações são necessárias para conseguir comprar duas medidas diferentes como metros e altura.

- A estatística descritiva nos dão idéia das estratégias de marketing

- O Gretl não calcula moda (20201202 03:12pm)

QUESTIONAMENTOS A SEREM RESPONDIDOS EM RELAÇÃO ÀS VENDAS

  1. Será que a variação do preço esta relacionada a variação das vendas ?
  2. Será que o fato da marca variar menos o preço no segundo ano, impactou nas vendas ?

SOFTWARE A UTILIZAR E LINGUAGEM DE PROGRAMAÇÃO

Nesta aula aprenderemos a instalar o RStudio para programar na linguagem R e utilizaremos o Gretl para aprender estatística descritiva.

Confira instalação do R a partir do minuto 03:56 na Aula 02: Marketing Analytics - Prof. Thiago Marques(USP/IBGE) e Marcos Severo (UFG)




Fontes de estudo