Hoje, estamos vivendo o quarto paradigma da ciência, que tem como principal objetivo redefinir o modo operacional da TI a fim de atender os desafios impostos pela quantidade de dados produzidos diariamente.

Toda vez que alguém envia uma mensagem de texto, publica uma foto no Instagram ou Facebook, clica em um link ou adquire algum produto online, estão sendo gerados dados. Além disso, estima-se que, a cada dois anos, o mundo dobra a taxa com que os dados são produzidos.

Como resultado das transformações na ciência e no mundo dos negócios, e como retorno às demandas existentes nas organizações, observamos a expansão de uma área de estudo interdisciplinar e intensivamente computacional: a Ciência de Dados (Data Science) –  que é baseada na extração de conhecimento para tomada de decisão empresarial através de uma grande quantidade de dados, seja em Big Data, seja em um banco de dados tradicional.

Dentre as disciplinas comportamentais necessárias para a aplicação da Ciência de Dados, pode-se incluir um conjunto de habilidades que caracterizam um “profissional unicórnio”. Isto é, um profissional multidisciplinar que deve englobar conhecimentos relacionados a Inteligência de Negócio, Matemática e Estatística e Ciência da Computação.

conhecimentos-multidisciplinares-necessrios-para-a-cincia-de-dados - Bridge Consulting

Figura: Conhecimentos multidisciplinares necessários para a Ciência de Dados.

 

Os cientistas de dados se direcionam aos problemas encontrados nas empresas a partir de três etapas, que se integram com um grande potencial de aplicação nos mais variados setores da economia e da sociedade:

  • Web scraping e coleta de dados: Capacidade de automatizar a leitura de informações de diferentes fontes de forma intensiva. Esta competência tem sido muito utilizada na coleta de dados do setor público com a finalidade de se detectar desvios de verbas ou ainda de verificar os gastos de governos e fundações.
  • Data mining (mineração de dados): Os dados coletados são organizados, processados e dispostos de maneira inteligente para identificação de padrões e informações relevantes. Dados ocultos são frequentemente descobertos nesta etapa e, com isto, é possível que as empresas obtenham fortes vantagens através de um conhecimento diferenciado, em um mundo marcado pela assimetria de informação.
  • Inteligência Artificial e Machine Learning: Após a identificação de padrões, as informações são processadas por algoritmos inteligentes e robustos, capazes de aprender com os próprios erros ou com dados subjetivos fornecidos pelo usuário. Conclusões pouco intuitivas são aqui geradas: novas estratégias e novas fontes de lucros podem ser descobertas e aprofundadas.

 

Data Science aplicado ao negócio

Os dados analisados permitem que empresas e organizações conheçam mais a fundo seus clientes, produtos e processos. Coletar dados, processá-los, aprender com eles, mudar e repetir: esta é a receita básica para aplicar Data Science nas corporações.

Dentre os diversos casos de utilização de Data Science para modificação da estratégia do negócio alguns se destacam, como o caso do maior site de e-commerce do mundo –  Amazon -, da Netflix e até mesmo de um departamento de polícia de Memphis.

A Amazon deu início ao projeto de recomendação de produtos para o cliente durante os anos 1990. Para isto, mapearam os perfis dos clientes a partir da base de dados existente e, através de análises estatísticas, conseguiram sugerir outros itens de compra para aquele determinado perfil. Um estudo do Gartner mostra que 15-20% do negócio da Amazon é proveniente da recomendação de produto.

A Netflix, que, hoje, domina o mercado VOD (Video On Demand), utiliza Data Science para analisar e propor algoritmos que personalizem o atendimento e o conteúdo, analisem melhores dispositivos e conheçam os hábitos dos clientes. Além disso, conseguem identificar nichos de perfis que sejam aderentes a determinados conteúdos, muitas vezes rejeitados por diversas emissoras de TV, como ocorreu com a série “Stranger Things” rejeitada por, pelo menos, 15 emissoras antes de ser acolhida pela Netflix.

Já o departamento de inteligência de polícia de Memphis, nos Estados Unidos, utilizou o Data Science para analisar dados dos crimes recorrentes na cidade. Após verificarem uma crescente taxa de criminalidade e utilizarem o Data Science para analisar os dados dos crimes, foi possível avaliar os riscos de segurança pública e tomar decisões inteligentes sobre a implantação de pessoal, além de descobrir relações ocultas nos dados e gerar previsões de crime. A aplicação desta tecnologia ajudou na queda de 35% de homicídios na cidade e de 20% de assaltos e o ROI (Return on Investiments) da solução foi estimado em 863%, segundo artigo publicado pelo Gartner.

É evidente que o campo de Ciência de Dados vem se tornando cada vez mais importante. De acordo com a IBM, essa tecnologia terá sua demanda aumentada em 28% até 2020. O contexto competitivo é simples: se uma organização toma decisões sem analisar dados e seu concorrente opta por estratégias baseadas na identificação de padrões e análises de dados, há maior probabilidade de o concorrente obter melhores resultados. Nesse contexto, as organizações que entenderem a necessidade de aplicar esta tecnologia de acordo com a demanda do negócio estarão inseridas no núcleo do novo modelo de mercado, apresentando resultados mais representativos.

Adriana Nardi é Engenheira Química pela PUC (RJ) e consultora na Bridge Consulting. Atua na Gestão Orçamentário e de Portfólio da TI em clientes do setor privado.