21 abril 2025

Governo de Dados: os vetores de atuação

A crescente necessidade de uma prática de governo corporativa é impulsionada por uma combinação de fatores, incluindo crescentes preocupações com a segurança e privacidade dos dados, a existência de normativas e frameworks regulatórias no âmbito da proteção de dados e inteligência artificial, como o AI Act, bem como o surgimento de arquiteturas de dados descentralizadas.

A visão holística e integrada sobre os dados passou a ser um fator crítico e até uma necessidade regulatória.

É, por isso, imprescindível assegurar a integridade, rastreabilidade, confiabilidade e disponibilidade dos dados através da implementação de processos transparentes e consonantes com as guidelines organizacionais e a legislação em vigor. Mais do que pensarmos nos dados que nos governam, precisamos de definir como os vamos governar.

Assim, as organizações procuram atualmente arquiteturas que fomentem a colaboração e a democratização, a par da uniformização, por meio de implementações como microserviços ou Data Mesh em dados.

Torna-se, por isso, fundamental para as organizações a implementação de uma prática sólida de governo de dados transversal e centralizada, que garanta as seguintes dimensões de Data Governance essenciais às organizações:

 1) conhecimento sobre todos os dados existentes;
 2) garantia de consistência e qualidade dos mesmos;
 3) clara compreensão de todo o seu ciclo de vida e transformações associadas;
 4) informação sobre as suas finalidades de utilização;
 5) gestão dos dados de acordo com as políticas e diretrizes corporativas;
 6) tratamento adequado de dados sensíveis de acordo com a legislação nacional e/ou europeia;
 7) conhecimento facilmente acessível sobre o ownership;
 8) know-how estratégico para apoio à decisão operacional e de negócio.

Para que a prática de Data Governance seja estabelecida com sucesso e faça parte do quotidiano das organizações é, primeiramente, imperativa a existência de uma cultura organizacional na qual os dados são um ativo estratégico, desempenhando um papel central nas tomadas de decisão e encontrando-se a sua literacia amplamente disseminada.

Aliada à cultura, são também indispensáveis os três pilares basilares de qualquer framework de governo de dados:

  • As pessoas: são parte integrante e vital no sucesso destas iniciativas e têm de ser envolvidas ao longo de toda a cadeia de valor dos dados de acordo com as suas responsabilidades e processos estabelecidos.
  • Os processos: traduzem-se na implementação e definição prática de procedimentos e diretrizes ao longo de todo o ciclo de vida dos dados, assegurando a sua auditoria e compliance.
  • Os enablers tecnológicos: aceleradores da execução e adoção real dos processos, permitindo às organizações responder eficazmente a desafios complexos que, sem recurso à tecnologia, seriam naturalmente mais morosos.
Data Governance - infografia

Relativamente a este último ponto, a crescente sensibilização e importância destas temáticas tem sido o catalisador para uma elevada proliferação de ferramentas de governo de dados no mercado. Contudo, grande parte delas são direcionadas para stakeholders que desempenham funções puramente técnicas, dispondo apenas de funcionalidades como o catálogo ou o lineage.

A fim de evitar esta perspetiva unidimensional e impulsionar a democratização controlada dos dados, são necessários benefícios adicionais que permitam envolver todo o espetro de utilizadores, disponibilizando uma visão 360 sobre estes ativos.

Podemos identificar sete vetores tecnológicos principais onde uma solução de governo de dados deve atuar:

  1. Catálogo de dados: representa o repositório central de todos os dados corporativos sendo responsável pela organização dos metadados que uma organização possui e permitindo aos utilizadores encontrarem facilmente os recursos de dados existentes, entenderem as suas fontes, estrutura e contexto. Tanto a classificação (inferência do tipo de dados, muitas vezes recorrendo a inteligência artificial) como o profiling e sampling (estatísticas e amostras dos dados, respetivamente) são alguns exemplos de funções que devem integrar o catálogo, facilitando o seu entendimento (responde ao ponto 1) das dimensões corporativas).
     
  2. Qualidade de dados: a execução, disponibilização e monitorização contínua de métricas de qualidade é fundamental para assegurar a integridade, precisão e consistência dos dados, garantindo assim confiabilidade nas decisões estratégicas ou mesmo em simples análises. A framework DAMA-DMBOK faz referência a oito dimensões amplamente reconhecidas e aceites e que devem ser consideradas nos processos de avaliação de qualidade dos dados: accuracy, completeness, consistency, integrity, reasonability, timeliness, uniqueness e validity (responde ao ponto 2) das dimensões corporativas).
     
  3. Data Lineage: identifica as várias etapas pelas quais os dados passam, permitindo a sua rastreabilidade ao longo de todo o seu ciclo de vida, bem como análises de impacto de acordo com diferentes níveis de abstração. O lineage técnico, sendo o mais granular, apresenta todas as transformações físicas desde a fonte até ao destino. No lineage lógico, os conceitos físicos são abstraídos, disponibilizando apenas as relações entre as várias entidades e respetivas transformações. Já o lineage de negócio ajuda a entender como os dados afetam os processos de negócio e são usados para gerar valor (responde ao ponto 3) das dimensões corporativas).
     
  4. Gestão de metadados: para além da recolha de metadados provenientes das fontes de dados, é necessária também uma gestão eficiente de outro tipo de metadados técnicos, operacionais e de negócio. Estruturas como os dicionários de dados permitem não só dar visibilidade de toda a camada física (bases de dados, schemas, colunas, entre outros) mas também da sua associação com as estruturas lógicas tipicamente definidas ao nível da modelação. Por outro lado, o glossário de negócio permite a existência de uma linguagem comum a toda a organização através da definição de conceitos e terminologias standard. Relatórios, KPIs ou métricas são também alguns exemplos de metadados de reporting que ajudam na avaliação do progresso de objetivos (responde ao ponto 4) das dimensões corporativas).
     
  5. Governo de Dados: a definição e implementação de políticas e standards são a base de qualquer programa de governo de dados, uma vez que ditam as diretrizes de utilização dos data assets nas suas várias vertentes (qualidade, acesso, segurança, privacidade, entre outros). Adicionalmente, a gestão de master e reference data tem também um papel preponderante na identificação da informação crucial para o negócio e no estabelecimento de uma categorização comum e estável em todos os sistemas corporativos (responde ao ponto 5) das dimensões corporativas).
     
  6. Privacidade dos Dados: o acesso e tratamento de dados, nomeadamente dados pessoais e confidenciais, é atualmente uma matéria de grande relevo. Dadas as várias normativas e regulamentos em vigor, como é o caso do RGPD na União Europeia, a gestão deste tipo de informação obriga à implementação de políticas rigorosas de privacidade e segurança, garantindo o acesso, recolha, tratamento e armazenamento adequados. Uma ferramenta de governo tem de ter a capacidade de identificar e definir políticas associadas a este tipo de informação para que a sua gestão esteja em conformidade com as frameworks regulatórias e processos internos (responde ao ponto 6) das dimensões corporativas).
     
  7. Ownership e stewardship: o sucesso de uma estratégia de governo de dados parte também da atribuição de roles e responsabilidades claras ao longo de toda a cadeia de valor. Estes roles deverão estar representados nas ferramentas de governo e alinhados com a estrutura e processos organizacionais, de forma a potenciar a eficiência operacional. Apesar de não existir um standard na definição destas funções, existem duas transversalmente reconhecidas no âmbito destas iniciativas: os Data Owners, responsáveis pela propriedade dos dados e respetivas tomadas de decisão, e os Data Stewards, responsáveis pela manutenção e gestão quotidiana dos dados, garantido a sua disponibilidade e consistência com as políticas de governo (responde ao ponto 7) das dimensões corporativas).

Estes sete vetores tecnológicos de atuação, aliados à automação de processos - como por exemplo a capacidade de gerir fluxos de aprovação de acesso aos dados autonomamente e a capacidade de auditoria e monitorização - oferecem às organizações uma visão completa, precisa e integrada de todo o seu ecossistema de dados, fornecendo assim insights valiosos nas tomadas de decisão estratégicas (responde ao ponto 8) das dimensões corporativas)


Rita Florêncio, Data Solutions Architect - Claranet Portugal