');
transparente.png

HEALTH LAKE

Dados públicos e privados
sobre a saúde brasileira
ao seu alcance

About me

Um lago de dados brasileiro no domínio da saúde

Lago de Dados

Atualmente necessitamos de uma forma unificada, escalável, resiliente e auditável para armazenar dados relativos ao COVID-19 e posteriormente de outras doenças. Sempre com foco no Brasil.

Motivação

Sentimos a necessidade de criar um projeto com componentes open-source, executado por voluntários e sem fins lucrativos. Tudo isso patrocinado e apoiado por empresas de base tecnológica. Vimos de perto a situação desesperadora do Brasil frente aos desafios de coleta e integração de dados. Nosso sonho é mudar nosso país para uma cultura mais data-driven, começando pela saúde.

Como

Depois de acompanhar vários projetos relacionados ao COVID-19 entendemos que a melhor maneira seria atuar na "causa raiz" dos problemas. Uma fonte confiável que permanecesse disponível até mesmo após falhas eventuais das plataformas do governo. Dito isso, surgimos com a ideia de um Lago de Dados com informações públicas e privadas da saúde, começando pela pandemia do novo Coronavírus.

Longevidade

O projeto iniciou-se durante a pandemia do COVID-19, mas não se limita a ela. A ideia central do projeto é que outras doenças sejam integradas e que o acesso aos dados seja patrocinado por entidades públicas e privadas de forma vitalícia

Onde

Todos os dados são armazenados em nuvem. A arquitetura do projeto prevê em um segundo momento uma redundância através da disponibilização dos dados em três nuvens principais de mercado. Com a correta utilização dos créditos, temos a possibilidade de permitir o acesso a todos os pesquisadores ou profissionais de dados que queiram investigar os dados de saúde armazenados no COVID Lake

Custos

As horas de profissionais utilizadas no projeto são totalmente voluntárias e os custos de cloud, design e marketing foram inicialmente patrocinados pela DataSprints.
O projeto é aberto para contribuições monetárias de pessoas físicas, jurídicas e governamentais.

APOIADORES E PATROCINADORES

DATASPRINTS

Patrocinador

Consultoria de Inteligência de Dados ponta a ponta. Participa ativamente da evolução do projeto atuando como facilitadora e provedora para o projeto, investindo tempo de colaboradores e o auxiliando com recursos mensais (nuvem, marketing, design etc.)

www.datasprints.com

Amazon Web Services

Patrocinador

Web Services da Amazon, a AWS patrocinou o projeto com 100.000 USD de créditos para uso da nuvem AWS S3, além disso contamos com seu apoio institucional na promoção de eventos e divulgação do conteúdo desenvolvido.

www.aws.com.br

INLOCO

Apoiador

Empresa de tecnologia de base privada especialista em serviços de geolocalização. Fornece dados de mobilidade anonimizada de Brasileiros usuários de aplicativos mobile.

www.inloco.com

PEBMED

Apoiador

Plataforma de conteúdo para profissionais de saúde de base privada. Fornece dados anonimizados de consumo de conteúdo de saúde por médicos Brasileiros usuários do aplicativo Whitebook.

www.pebmed.com

COLETIX

Patrocinador

Serviço de coleta de dados fornecedor de pipelines específicas de integração dados e monitoria de qualidade.

www.coletix.com

SPOT SCI

Apoiador

Plataforma de conteúdo jornalístico de divulgação científica e material didático qualificado para o ensino de ciências.

www.spotsci.com

Nossos Líderes Técnicos

Beatriz Antunes

Data Project Manager

Gerencia a área de Engenharia de Dados.

Linkedin

Bruno Braziel

Data Engineering Tech Lead

Atua como Tech Lead do time de Engenharia, gerenciando a infraestrutura de dados do projeto.

Linkedin

Guilherme Eid

Data Analysis Tech Lead

Desenvolve análises em Plataformas de Visualização a partir dos dados disponíveis no Lago.

Linkedin

Larissa Eletério

Data Science Tech Lead

Atua na publicação de artigos a partir das análises dos dados disponíveis no Lago e auxilia a equipe de Engenharia na documentação das bases de dados e na elaboração de pipelines.

Linkedin

Luccas Meireles

Data Project Manager

Responsável por auxiliar e definir os padrões de gerenciamento de projeto, a fim de otimizar o controle e a execução das propostas de acordo com a organização.

Linkedin

Marcelo Felippe

Data Engineering Tech Lead

Atua no desenvolvimento da infraestrutura do projeto e na orquestração das demandas da engenharia. Além disso, também atua em um projeto end-to-end utilizando Machine Learning, Engenharia e Ciência de Dados.

Linkedin

Pedro Gemal

Technical Lead

Apoio na concepção e execução de projetos de dados.

Linkedin

Thaís Nunes

Communication Tech Lead

Lidera a equipe de Comunicação responsável pelo gerenciamento de mídias sociais, site e relações pública. Além de atuar na captação de recursos e desenvolvimento de parcerias para o projeto.

Linkedin

Victor Arnaud

Data Project Manager

Responsável por auxiliar e definir os padrões de gerenciamento de projeto, com foco nos time de ciência e análise de dados.

Linkedin

Conheça todos os voluntários

FAQ

Isso é um BI, Dashboard, Relatório?

Uma das possibilidades de disponibilização dos dados são relatórios com gráficos interativos, largamente conhecidos pela aplicação corporativa de ferramentas de self-service BI (Business Intelligence). No entanto, o COVID Lake pode ser disponibilizado através de análises estatísticas, modelos estatísticos ou de Inteligência Artificial. Em alguns casos, o lago pode ser utilizado simplesmente como uma maneira de explorar os dados disponíveis e comparar com análises prévias.

O foco é Global ou Estadual?

Nenhum dos dois. Focamos no Brasil e em dados granulares ao nível de municípios. Cogitamos a possibilidade de termos dados de pessoas anonimizados, mas até o presente momento, os dados de geolocalização são os mais granulares disponíveis.

Esse é mais um monitor de casos diagnosticados sem inteligência?

Apesar de reconhecermos a dificuldade em obtermos dados confiáveis no Brasil, o objetivo do projeto não é o de prover somente dados para análises descritivas. Queremos impactar estudos que trabalham com análises prescritivas, como: "Quando é a melhor época para a volta às aulas?"

Como posso ajudar?

Envie um email para queroservoluntario@datasprints.com com seu currículo ou Linkedin, um parágrafo descrevendo sua motivação e onde acha que faria sentido contar com sua ajuda

Os dados do COVID Lake estão sujeitos à legislaçao nacional e internacional de proteção de dados pessoais?

Não! Todos os dados que compõem o COVID LAKE são anonimizados, portanto, não configuram dados pessoais.

E se eu quiser comercializar dados do COVID Lake?

O COVID LAKE é um serviço de natureza pública, de acesso gratuito.
É expressamente vedada a utilização de qualquer dado disponibilizado no HEALTH LAKE para desenvolver produto ou serviço comercializável. Essa prática configurará violação da licença de distribuição dos dados.