Formulário de Definição do Problema em Projetos de Ciência de Dados

Pergunta Descrição Resposta
Descrição do problema Descreva o problema que o projeto de ciência de dados irá abordar. Certifique-se de incluir a causa raiz do problema e como ele afeta o negócio. A dificuldade em prever quais filmes terão sucesso de bilheteria A máquina não pode falhar pois ela impacta na perda de receita.
Objetivos do projeto: Descreva os objetivos específicos do projeto. Por que estamos fazendo este projeto de ciência de dados? O que esperamos alcançar com a análise de dados? Certifique-se de que os objetivos sejam mensuráveis e realistas. Prever se um filme terá sucesso de bilheteria Mostrar quando a máquina irá quebrar e a pessoa fará uma manutenção preventiva.
Stakeholders: Identifique os principais stakeholders envolvidos no projeto de ciência de dados. Quem serão os principais beneficiários da solução proposta? Quais são as expectativas desses stakeholders em relação ao projeto? Os stakeholders que poderão se beneficiar são os líderes da indústria cinematográfica, além de diretores e atores.
Dados: Quais dados serão necessários para resolver o problema identificado? Onde esses dados podem ser encontrados? Quais são as limitações em relação à qualidade e quantidade dos dados? [The Movies Dataset Kaggle](https://www.kaggle.com/datasets/rounakbanik/the-movies-dataset) - Esse Dataset reúne informação de aproximadamente 45000 filmes. Dentro das features temos: cartazes, cenários, orçamento, receita, datas de lançamento, idiomas, países de produção e empresas, além de informações sobre elenco e notas atribuídas a eles.
Métricas: Quais são as métricas que serão usadas para medir o sucesso do projeto? Como o sucesso será medido? Certifique-se de que as métricas estejam alinhadas com os objetivos do projeto. Precisão das Previsões: Mediremos a precisão das previsões comparando as previsões feitas pelo modelo com os valores reais de receita. Também utilizaremos métricas como o Erro Médio Absoluto (MAE) e o Erro Quadrático Médio (MSE).
Suposições e limitações: Quais são as suposições que estão sendo feitas sobre o problema e a solução proposta? Existem limitações técnicas ou financeiras que podem afetar a solução proposta? Inicialmente supomos que o Elenco e o valor gasto no filme pode afetar a receita, assim como a expectativa do cliente.
Cronograma: Qual é o cronograma do projeto? Quando cada fase do projeto será concluída? Quais são os principais marcos do projeto? Iniciaremos utilizando o método SCRUM com Sprints de 2 semanas para cada etapa do projeto de Ciencia de Dados:
  1. Definição do problema 2: Coleta de dados 3: Análise Exploratória 4: Construção do Modelo de previsão 5: Construção da visualização e Storytelling | | | Orçamento: | Qual é o orçamento disponível para o projeto? Quais são os custos previstos para cada fase do projeto? | Não aplicável - Projeto para fins didáticos | |