Considerações de observabilidade de dados e práticas recomendadas com astrônomos

Considerações de observabilidade de dados e práticas recomendadas com astrônomos

O monitoramento e a observabilidade são cruciais no desenvolvimento de pipelines de dados confiáveis ​​e confiáveis ​​que efetivamente alimentam painéis, relatórios e análises. Apesar de seu significado, os métodos tradicionais de monitoramento não conseguem abordar adequadamente as nuances dos dados modernos. Alertas puramente reativos, emparelhados com supervisão fragmentada, perdem a marca de observabilidade para muitas empresas.

Examinando a próxima evolução da observabilidade dos dados, especialistas do astrônomo se juntaram DBTAé o webinar, Melhores práticas para observabilidade de dados e pipelines de fluxo de ar Apache confiáveisArmado com informações e estratégias valiosas para adaptar a observabilidade dos dados às necessidades dos dados e negócios modernos.

Em sua essência, a crescente importância estratégica da Data enfatiza a importância das equipes de dados de alto funcionamento. Isso soa ainda mais verdadeiro com a ascensão de Genai, à medida que a proliferação de novos modelos reafirma a necessidade de dados de alta qualidade para alimentar esses sistemas avançados, explicou Naveen Sukumar, chefe de PMM e Devrel, Astrônomo.

No entanto, vários desafios impedem o sucesso dos dados: de ambientes silenciados e fragmentados a disponibilidade de habilidades limitadas, trabalho e despesa não diferenciados e supervisão limitada sobre a qualidade e governança dos dados, as equipes de dados não têm falta de obstáculos que diminuem inerentemente o tempo de mercado, aumenta o custo e o risco e inibe a inovação da IA/MLOPS.

O DataOps, de acordo com Sukumar, é a chave para superar os desafios atuais de dados. Unificação de orquestração e observabilidade de dados, o DataOps permite:

  • Aumento da agilidade e colaboração de desenvolvimento
  • Velocidade, escala e previsibilidade aprimoradas da entrega de dados
  • Qualidade aprimorada de dados, confiança e governança com transparência de custo

O valor do DataOps é claro; como Gartner prevê: “Até 2026, uma equipe de engenharia de dados guiada pelas práticas e ferramentas do DataOps será 10 vezes mais produtiva do que as equipes que não usam o DataOps”.

Focando na primeira parte do DataOps, a orquestração de dados permite o movimento de dados de um sistema para outro de uma maneira automatizada, geralmente programada. Em última análise, isso ajuda a unificar propriedades de dados complexas, ativar a colaboração entre equipes, simplificar as pilhas de tecnologia e impulsionar a governança através da visibilidade.

“A orquestração é como estamos fazendo com que essa pilha de dados fragmentada funcione para você, unificando sua propriedade e tornando tudo integrado e coeso”, disse Sukumar.

A segunda metade do DataOps, a observabilidade dos dados, evoluiu significativamente, de acordo com Sukumar. Observabilidade dos dados – ou a capacidade de entender a saúde de seus dados e seu estado em seu ecossistema de dados, a qualquer momento – é crucial para impulsionar a qualidade, a confiança e a confiabilidade dos dados. Sua evolução se expande além do simplesmente monitoramento – que captura as “incógnitas conhecidas” – e captura as “desconhecidas desconhecidas”, como Sukumar disse. Tornou-se a profunda introspecção do pipeline de dados para alimentar a resolução proativa, que, quando emparelhada com a orquestração de dados, é um componente crítico do suporte a aplicativos e tomada de decisão orientados a dados.

Examinando algumas práticas recomendadas de observabilidade de dados, Sukumar apontou para as seguintes maneiras de fazer a transição do combate reativo para o gerenciamento proativo:

  1. Estabeleça uma propriedade clara: A propriedade clara garante responsabilidade e alto impacto.
  2. Implementando alerta proativa com contexto: A alerta proativa evita violações do SLA e minimiza o impacto.
  3. Documentando a propriedade em um local centralizado: A documentação centralizada reduz a confusão, mas carece de urgência.
  4. Definindo SLAs significativos alinhados com as necessidades de negócios: Os SLAs alinhados aos negócios aumentam a relevância.

Sukumar acrescentou ainda que o estabelecimento de visibilidade abrangente com um sistema de melhoria contínua é uma abordagem formidável para a observabilidade dos dados. Isso inclui o monitoramento de toda a cadeia de suprimentos de dados; visibilidade em toda a organização através de painéis; incorporando observabilidade nos fluxos de trabalho de desenvolvimento; Monitorando os padrões de consumo de recursos e execução; e mais.

O astrônomo, a empresa que ajuda a moldar e simplificar o Apache Airflow de código aberto, fornece soluções de valor agregado que levam o fluxo de ar para o próximo nível. O Astro observa o mais recente produto do astrônomo, fornece um único painel de vidro para governar e otimizar o produto de dados e o ciclo de vida do pipeline com linhagem completa, alerta e recomendações proativas, explicou Sukumar. Oferece recursos como:

  • Visibilidade no nível do pipeline
  • Produto de dados SLAs
  • Catálogo de ativos para facilitar a descoberta
  • Otimizações proativas de pipelines
  • Data Health Painel
  • Vista da linha do tempo do desempenho do nível de tarefa

Jake Roach, engenheiro de dados de campo, Astrônomodepois levou os visualizadores de seminários on -line através de uma demonstração da solução de observação do Astro.

Este é apenas um trecho do total Melhores práticas para observabilidade de dados e pipelines de fluxo de ar Apache confiáveis webinar. Para o webinar completo, apresentando explicações mais detalhadas, pesquisas ao vivo, perguntas e respostas e muito mais, você pode ver uma versão arquivada do webinar aqui.

Solana Token Creator

Comments

No comments yet. Why don’t you start the discussion?

Leave a Reply

Your email address will not be published. Required fields are marked *