Skip to content

Projeto 2 - Bootcamp de Ciência Dados do programa Desenvolve da Boticário/ALURA, Realize uma análise completa usando Python e a biblioteca Pandas numa base de dados de preços de aluguéis em São Paulo. Utilize a regressão linear para modelar uma relação entre variáveis do conjunto de dados.

Notifications You must be signed in to change notification settings

CarolyneS14/Analise_e_Predicao_Imoveis_SP

Repository files navigation

📊 🏘️ 🏗️ Análise e Predição Imóveis SP

Caso

Este projeto trata-se de uma análise de imóveis disponíveis para locação na cidade de São Paulo.

Objetivo

Nesta análise foi utilizada uma base de dados que apresenta algumas informações como o tipo de imóvel e suas caracaterísticas, bem como a localização e os valores do aluguel, afim de verificar a correlação entre as variáveis existentae e realizar a predição do valor do Aluguel com base na variável Área.

Conclusões

Diante da análise de regressão linear realizada, observou-se que a variável R² é igual a 0,44. Isso indica que 44% da variabilidade no valor do aluguel pode ser explicada pela área do imóvel. Portanto, é possível afirmar que esta variável auxilia na previsão do aluguel, uma vez que, dependendo do tamanho do imóvel, o valor do aluguel sofre alterações.

Além disso, foi possível observar que diversas variáveis influenciam os valores dos aluguéis. As variáveis mais relevantes para prever o valor do aluguel são a quantidade de garagens, a área, o valor total do aluguel e a quantidade de quartos. As variáveis que tendem a aumentar o valor do aluguel são a área, a quantidade de quartos e a quantidade de garagens. Por outro lado, a variável que pode reduzir o valor é o valor total do aluguel. Ao comparar o valor do aluguel com o valor total do aluguel e a área, o R² resultou em 0,41, ou seja, 41%.

O gráfico de distribuição de despesas evidencia isso claramente, ao mostrar que imóveis do tipo apartamento, casa em condomínio e casa estão entre os de maior valor.

Na análise de predição do aluguel, utilizou-se como base um imóvel com área de 60m² e obtive-se o resultado de R$ 2.656,19.

Em resumo, para aprimorar a análise, é recomendável realizar uma segmentação por regiões, o que proporcionaria uma compreensão mais detalhada dos dados. Especificar claramente o que representa a coluna 'Total' também é fundamental para evitar ambiguidades. Além disso, a inclusão dos valores das despesas por região adicionaria uma camada de profundidade à análise financeira. Por fim, incorporar variáveis adicionais como proximidade de hospitais, shoppings, mercados, escolas, faculdades e meios de transporte pode fornecer insights valiosos, contribuindo para uma análise mais robusta e informada.

Recomendações

• Especificar o que representa a coluna 'Total' de modo a evitar ambiguidades.

• Incorporar variáveis adicionais como proximidade de hospitais, shoppings, mercados, escolas, faculdades e meios de transporte pode fornecer insights valiosos, contribuindo para uma análise mais robusta e informada

• Incluir os valores das despesas por região, para adicionar uma camada de profundidade à análise financeira.

• Segmentar por regiões, para proporcionar uma compreensão mais detalhada dos dados.

Melhorias Futuras

Realizar uma análise mas profunda segmentando os imóveis por região e fazer novas predições com base nas regiões e com base em variáveis como quartos, garagens, meios de transportes, etc.

Ferramentas

  • Google Sheets: importei a base de dados em csv.
  • Google Colab (Python): para realizar análises em Python.
  • Google Slides: para criar apresentação dos insights obtidos.

Links úteis

(1) Desenvolvimento - 💻Google Colab
(2) Apresentação - ✳️Google Slides
(3) BaseDeDados - ✳️Google Sheets

🤝 Colaboradores

Carolyne Oliveira: Linkedin
Marcel Hikaru Yamanaka: Linkedin
Layanne Mary: Linkedin

About

Projeto 2 - Bootcamp de Ciência Dados do programa Desenvolve da Boticário/ALURA, Realize uma análise completa usando Python e a biblioteca Pandas numa base de dados de preços de aluguéis em São Paulo. Utilize a regressão linear para modelar uma relação entre variáveis do conjunto de dados.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published