Domine a análise de dados com as melhores práticas usando NumPy e Pandas
Domine a análise de dados com as melhores práticas usando NumPy e Pandas Para processar e analisar grandes quantidades de dados, é essencial ter ferramentas eficientes e poderosas. O NumPy e o Pandas são duas bibliotecas Python amplamente utilizadas no processamento de dados. O NumPy é uma biblioteca que fornece suporte para operações numéricas em […]
Consultando dados no Data Lake na AWS – 1 Athena
Consultando dados no Data Lake na AWS
O Athena é um importante serviço sem servidor da AWS – fundamental para os analistas de dados, engenheiros e cientistas que usam a AWS. É um serviço de consulta intuitivo e fácil de usar, sem necessidade de administração, e você paga apenas pelos dados digitalizados nas consultas que fizer. Aproveitar a compactação de dados ou usar formatos colunares pode reduzir os dados digitalizados e, assim, reduzir os custos.
Otimizando Data Lakes com Parquet – 2 exemplo com AWS
Data Lakes com Parquet Este artigo é o primeiro de uma série chamada ‘Foca no data lake’, na qual apresentaremos várias tecnologias para execução de consultas analíticas em data lakes na AWS . Indo direto ao assunto existem muitas tecnologias disponíveis que você pode usar para consultar big data na AWS, cada uma com seus prós e […]
As 5 principais boas práticas de Big Data
Vamos olhar as principais boas práticas de big data para transformar dados em vantagem. Big data – a palavra diz tudo – é uma enorme quantidade de dados que são coletados e gerados em organizações, mídias sociais, Internet e várias outras fontes. As organizações que utilizam a análise de big data devem primeiro entender completamente as […]