top of page
Foto do escritorElaine Figueiredo

Data Science – Entendendo o Problema

Atualizado: 5 de jun. de 2023

Entendendo o Problema a premissa de qualquer projeto e para Data Science não é diferente.


Surgimento da demanda

Eu realmente preciso?

Quanto de vou precisar gastar? - Entendendo o problema

Encontrei um modelo que atende minha necessidade?

Preciso pesquisar quais os modelos e tecnologias envolvidas na atualidade - Coleta de dados

Processamento e exploração de dados/Análise de dados

Comunicação de resultados

Teste.

Feedback.


Os cientistas de dados são as pessoas que continuam perguntando o porquê das coisas. São as pessoas que desejam garantir que todas as decisões tomadas na empresa sejam suportadas por dados concretos e garantidas (com alta probabilidade) de obter bons resultados.

Antes que você possa iniciar um projeto de ciência de dados, é essencial que você entenda o problema que está tentando resolver.

“Quando você entrevista um cientista de dados… ‘Wow!

Você respondeu cada uma das perguntas perfeitamente. Como você fez isso?’.

‘Bem, eu me encontrei com cada pessoa que foi entrevistada por você nos últimos 5 anos e coletei as perguntas feitas por você, correlacionando-as com os parâmetros da entrevista. Aí eu criei um sistema que prevê a pergunta exata que você vai fazer, com 85% de previsão!’. ‘Wow!

Uma engenharia desenvolvida impressionante. Mas eu não posso contratar você, por questões éticas’. ‘Ah, não se preocupe. Com essa oportunidade eu estava só testando o meu sistema de previsão’”.


Usamos a ciência de dados para responder a cinco tipos de perguntas:

Quanto ou quantos? (Regressão);

Qual categoria? (Classificação);

Qual grupo? (Agrupamento);

Isso está ficando estranho? (Detecção de anomalia);

Qual opção deve ser adotada? (Recomendação).


Nesse estágio, você também deve identificar os objetivos centrais do seu projeto,identificando as variáveis ​​que precisam ser previstas.


Se for uma regressão, pode ser algo como uma previsão de vendas. Se for um cluster, pode ser um perfil de cliente. Compreender o poder dos dados e como você pode utilizá-los para obter resultados para os seus negócios, fazendo as perguntas certas, é mais uma arte do que uma ciência; e fazer isso bem vem com muita experiência.


Compreender, entender a demanda, é importante identificar os objetivos centrais do seu projeto, identificando as variáveis que precisam ser previstas.


Essa é uma das etapas mais importante de todo o ciclo. É nela que precisamos gastar tempo suficiente para entender o problema de forma mais clara possível. Para isso, é importante que estejamos em constante comunicação com os stakeholders, as pessoas envolvidas no projeto, e/ou aqueles que irão se beneficiar com a solução.


Nessa fase, é papel do Cientista de Dados entender as dores dos stakeholders e fazer as perguntas certas, antes mesmo de “colocar a mão na massa”.


Dica 1: Utilizar a Técnica dos 5-Ws:

Porquê? (Why?): Porque é importante essa análise para o negócio?

Quem? (Who?): Quem iremos analisar? Nossos compradores? Fornecedores?

O quê? (What?): O que iremos analisar? Comportamento de compra?

Onde? (Where?): A análise estará voltada para o contexto nacional ou internacional?

Quando? (When?): Qual período será considerado para as análises?


Dica 2: Machine Learning Canvas (Louis Dorard) (https://www.ownml.co/machine-learning-canvas )


Converse com todos os Stakeholders para entender o problema.

Viva a experiência se possível e necessário.


É papel do Cientista de Dados entender as dores dos stakeholders e fazer as perguntas certas, antes mesmo de “colocar a mão na massa”. E aí gostou? deixe seu comentário.


Agile Data Science 2.0: Building Full-Stack Data Analytics Applications with Spark

Python para análise de Dados https://amzn.to/3Jr7IwH

Machine Learning Canvas (Louis Dorard) (https://www.ownml.co/machine-learning-canvas )


Quer saber mais? Conheça nossos treinamentos? No entanto, primeiro conheça seu perfil comportamental Clica no link e explore seus pontos fortes em quaisquer áreas que queira atuar. Lançaremos o treinamento Introdução a Data Science e Agile Data Science em Junho – Aguardem!

8 visualizações0 comentário

Comments


bottom of page