Engenheiro de dados, analista de dados e cientista de dados: qual a diferença entre esses profissionais? Você já sabe que o gerenciamento de dados é importante para qualquer empresa, e é bem provável que tenha chegado aqui por esse motivo.
Independentemente do porte, setor ou nicho do negócio, toda empresa gera diversos tipos de dados diariamente, que ficam alocados nas mais variadas fontes.
É exatamente aí que mora o valor dos dados, pois uma boa estratégia possibilita agregar diferentes informações com o objetivo de entender o passado, avaliar o presente e planejar o futuro. Dessa forma, é possível reduzir custos, otimizar processos, melhorar a produtividade e muito mais.
Afinal, pensando na execução de um projeto voltado para dados, ficam alguns questionamentos: como e em que parte do processo esses profissionais atuam? Como eles interagem? Quais as principais diferenças entre eles?
O que é importante considerar ao lidar com dados?
Quando se fala em dados, é muito comum que venha à tona uma famosa reflexão do matemático e empresário londrino Clive Humby: “dados são o novo petróleo”. Levando em consideração essa máxima, podemos entender que quem souber usar e aproveitar o seu potencial, tem muito a ganhar.
“É valioso, mas se não for refinado, não pode realmente ser usado. Precisa ser transformado em gás, plástico, produtos químicos, etc., para criar uma entidade valiosa que impulsione uma atividade lucrativa; portanto, os dados devem ser decompostos, analisados para que tenham valor,” finaliza o pensamento de Clive Humby.
Isso resume bem o que é necessário ponderar quando se deseja trabalhar com dados. Tê-los disponível é a condição básica, mas não é suficiente. Sendo assim, é preciso inteligência por trás deles, ou seja, coletá-los e disponibilizá-los de forma segura e consistente para que possam ser analisados e, enfim, gerar valor de fato para o negócio. E quem vai fazer isso?
O que faz um engenheiro de dados?
Intencionalmente começaremos pela engenharia de dados, que tem a seguinte definição formal: processo de coletar, limpar, transformar, armazenar, analisar e visualizar grandes quantidades de dados. Para entender melhor essa declaração, nada melhor que utilizarmos alguns exemplos do mundo real para ilustrar onde o engenheiro de dados se encaixa.
- Podemos pensar em uma loja online. Por hora, é possível chegar em centenas ou até em milhares de vendas, onde todas as informações geradas são importantes: quem fez a compra, de qual produto, por qual preço, para qual cidade é a entrega, etc.;
- Um outro exemplo é um banco. Além da ampla variedade de serviços ofertados (cartões, empréstimo, financiamento, investimento, etc.) e alta taxa de operações diárias, toda atividade precisa ser feita de maneira extremamente segura;
- Por último, uma situação muito comum é uma empresa que utiliza diversos sistemas para abranger partes do seu processo, como softwares de CRM, de ERP, de gerenciamento de projetos, além de softwares específicos da sua área de atuação.
De maneira geral, o que esses 3 exemplos nos mostram é que as empresas: produzem os mais diversos dados, oriundos das mais diversas fontes e necessitam da garantia de segurança e confiabilidade nos processos. Perceba que isso nada tem a ver com a análise dos dados em si, é uma etapa anterior e de extrema importância para garantir que seja possível extrair valor dos dados. Então é aí que entra o Engenheiro de Dados.
Seguindo esse raciocínio, temos:
- Se dados são gerados, é preciso coletá-los.
- Se há margem para inconsistências, é preciso limpá-los e transformá-los.
- Se queremos analisá-los e visualizá-los, temos que armazená-los em algum lugar.
Para aprofundar:
• Reduzindo custos com engenharia de dados
O que faz um analista de dados?
Aqui podemos considerar que temos os nossos dados disponíveis, e agora precisamos extrair valor deles. Até porque os dados por si só não têm valor algum para embasar conclusões, é necessário organizá-los e ordená-los de forma que seja possibilite transmitir significado para o negócio. É aí que entra o analista de dados.
Um(a) analista de dados atua antes mesmo de ter os dados em mãos. Sendo assim, antes de tirar qualquer conclusão, é preciso ter a compreensão do contexto e das necessidades da empresa. Portanto, vamos voltar para os exemplos apresentados anteriormente.
- Para a loja online: quais cidades têm maior representação nas vendas? Qual o faturamento nas diferentes épocas do ano? Qual o perfil de usuário para o produto X?
- Para o banco: qual a representação de cada serviço ofertado no faturamento total? Algum processo está tendo um custo de operação maior que o esperado? Como varia a taxa de operações ao longo de um dia?
- Na agregação de diversos sistemas: consigo reunir informações de planejamento, custos, entregas e pessoal envolvido em cada projeto da empresa? Quais padrões são possíveis de visualizar das interações com os clientes?
É a partir de perguntas como essas que o(a) analista de dados inicia o processo de organização e ordenação dos dados existentes, tendo como objetivo principal gerar informações para uma tomada de decisão alinhada à estratégia da empresa.
Alguns tipos de análise são possíveis:
(i) Análise descritiva: visa compreender e resumir o comportamento dos dados analisados; (ii) análise diagnóstica: busca encontrar relações de causa e efeito no conjunto que está sendo analisado; (iii) análise preditiva: analisam-se dados atuais e históricos para fazer projeções de cenários e identificar tendências; (iv) análise prescritiva: é unir a análise descritiva, a análise preditiva e o conhecimento do negócio, assim, buscando avaliar as consequências que determinadas decisões podem trazer.
Para aprofundar:
• 4 formas em que a análise de dados pode alavancar sua loja
O que faz um cientista de dados?
Apesar de estarmos dividindo as definições de cada área, elas se conectam em diversas etapas, e neste ponto chegamos em uma das profissões mais multidisciplinares: a ciência de dados.
Aqui, o modo de lidar com os dados vai um pouco além. É necessário encontrar anomalias, padrões e correlações nos conjuntos de dados para que seja possível prever os resultados da maneira mais eficiente possível – é a chamada mineração de dados.
Voltando para os exemplos, podemos enxergar a ciência de dados da seguinte forma:
- Para a loja online: a cidade ter maior ou menor representação nas vendas está relacionado com qual(is) outra(s) variável(eis)? A variação de faturamento ao longo do ano pode ser devido a qual(is) fator(es)? É possível criar um sistema de recomendação para os diferentes perfis de usuário?
- Para o banco: é possível encontrar padrões nas fraudes detectadas? Conseguimos entender que um cliente está em vias de cancelar um serviço e oferecer algo para que ele não o faça? O que é mais relevante no gerenciamento de risco para concessão de crédito?
- Agregando diversos sistemas: como se comportam determinados tipos de clientes? Quais variáveis envolvidas nas demandas atrasadas? O que pode estar influenciando na performance dos funcionários?
Essas não são perguntas simples de se responder. A princípio há muitos dados disponíveis, o que acaba gerando as mais diversas possibilidades de respostas, já que nem sempre as correlações são óbvias. Para isso, o(a) cientista de dados precisa entender as necessidades da empresa para transformar uma grande quantidade de dados em insights alinhados ao negócio.
É comum que o cientista de dados se utilize tanto da estatística quanto de técnicas de machine learning, buscando sempre descobrir relacionamentos ocultos e identificar tendências e fatores chaves em meio aos dados.
Por que investir em um time de dados?
Ao chegar ao fim desse texto fica claro o porquê de os dados estarem tomando conta do mundo dos negócios. Dessa forma, o cenário ideal é onde conseguimos juntar intuição e experiência com embasamento em dados, aprimorando, assim, a tomada de decisão.
Em conclusão, o analista de dados analisa dados numéricos e os usa para ajudar empresas a tomarem melhores decisões. O engenheiro de dados se envolve na preparação de dados. Eles desenvolvem, constroem, testam e mantêm uma arquitetura completa. Um cientista de dados analisa e interpreta dados complexos.
E, para executar bons projetos, profissionais qualificados são de extrema importância. Ou seja, se faz necessário não só ter objetivos claros e um bom planejamento, como também ter pessoas dedicadas no desenvolvimento, implementação e operacionalização dos projetos. Afinal, é isso que vai fazer com que se tenha boas percepções sobre tendências e comportamentos, o que vai garantir uma vantagem competitiva à empresa.
Leia mais:
• O que faz o analista de BI? Função, formação e salário
• Analista de Dados: o que faz e qual é sua rotina