• beatrizbenezra

Dados validando hipóteses ou dados gerando insights?

Atualizado: Jan 16


Existe um processo evolutivo de complexidade crescente na passagem da situação onde os dados são usados no apoio ao processo de tomada de decisão, para uma nova situação, onde estes dados são usados para descoberta de novo conhecimento.

O quadro evolutivo traçado na figura, logo a seguir, identifica dois grandes estados definidos a partir do nível de maturidade no aproveitamento de dados para a geração de conhecimento. O primeiro estado caracteriza organizações que usam dados como Sistemas de Apoio à Decisão (SAD). Neste caso, a análise dos dados visa validar hipóteses predefinidas, conhecimento já existente, que surgem do próprio contexto onde o conhecimento é aplicado. Este estado pode contemplar um leque bem amplo de tecnologias que abrangem das mais simples, que permitem apenas eventuais pesquisas diretas nos dados; até as mais sofisticadas, que propiciam a implementação de estruturas mais complexos para a combinação e tratamento dos dados. O fato é que em qualquer uma das suas versões o objetivo principal destas aplicações é disponibilizar informações para a tomada de decisão, possibilitando aos usuários melhor e mais rápidas decisões.

No segundo estado, os dados são tratados de forma a criar visões e novas hipóteses, novos conhecimentos que precisam ser avaliados, aprendidos e integrados ao conhecimento já existente no domínio ao qual pertencem. Em este segundo grupo estão as organizações que usam modelos de KDD (Knowledge Discovery in Databases). Em este caso o processo de formação do novo conhecimento inicia quando o negócio levanta questionamentos que serão respondidos com insights gerados a partir de padrões de dados. Estes padrões de dados são gerados mediante a aplicação de diferentes algoritmos de IA em um conjunto de dados. Esta última atividade é conhecida como Mineração de Dados. A Mineração de dados é apenas uma parte do processo de KDD. O processo de KDD é um processo altamente complexo, iterativo e interativo, envolvendo tecnologia e negócio. Devido à alta complexidade do processo os padrões de dados obtidos nem sempre são válidos. A sua validade ou não depende da capacidade destes padrões para gerar insights que possam ser usados para a geração de novo conhecimento que traga resultados relevantes ao negócio.

Na passagem de um estado a outro existe um aumento de complexidade na forma que se realiza a análise de dados. Esta complexidade é gerada pela multidisciplinaridade e interdisciplinaridade dada por elementos de tecnologia e do negócio que devem estar corretamente elencados para realizar a transição entre os dos estados.