Mostrando entradas 1 para 10
Displaying posts with tag: análise de dados (reset)
Previsões da Uber Engineering em tempo real com ELK

Os serviços da Uber dependem da precisão das ferramentas de previsão de eventos. Desde estimar a demanda do motorista em uma determinada data até prever quando uma ordem UberEATS chegará, a Uber usa algoritmos de previsão para melhorar as experiências do usuário (UX) em nosso portfólio de produtos.

Para arquitetar uma experiência de previsão precisa e facilmente interpretável para engenharia e operações, nós construímos um sistema de previsão personalizado, alavancando um mecanismo open source de pesquisa RESTful distribuído, composto pelo mecanismo de consulta Elasticsearch, o pipeline de indexação de dados …

[Leia mais]
Criando análises de dados com o Presto e o Parquet na Uber

Desde determinar os pontos de encontro mais convenientes para o motorista até projetar o caminho mais rápido, o Uber utiliza análises orientadas por dados para criar experiências de viagens perfeitas. Dentro da engenharia, são analisados os processos de tomada de decisão. Conforme expandimos para novos mercados, a habilidade de agregar dados precisa e rapidamente se torna ainda mais importante.

No início de 2014, a Uber tinha apenas algumas centenas de funcionários ao redor do mundo. Mas no final de 2016, tínhamos mais de duas mil pessoas executando mais de cem mil consultas analíticas diariamente. Nós precisávamos de um sistema de consultas de dados que pudesse acompanhar nosso crescimento. Para executar as consultas analíticas em várias fontes de dados, nós desenvolvemos um sistema analítico que aproveita o Presto, um motor SQL distribuído open source para grandes …

[Leia mais]
Projetando o Euclid para tornar a engenharia de marketing do Uber mais sábia

Rápido, granular e com ROI confiável no desempenho de anúncios foram o nosso estopim para construir Euclid, a plataforma de marketing interno do Uber. No início deste ano, a Euclid substituiu um sistema legado que processava os dados do ROI manualmente, enquanto lutava para se manter escalável com o Uber e a complexidade dos dados.

Ao contrário de qualquer solução fora da caixa, o Hadoop, ecossistema Euclid baseado em Spark, nos permite escalar o crescimento do Uber com uma arquitetura de plugin de API agnóstico de canal chamada MaRS, bem como um pipeline ETL personalizado que cede dados heterogêneos em um único esquema para uma consulta simples. Uma camada visual em cima da Euclid permite que os profissionais de marketing tirem métricas de ROI para otimizar o gasto com anúncios. As capacidades de reconhecimento de …

[Leia mais]
Crie um aplicativo de monitoramento SMS com IBM Bluemix e Watson Twilio add-ons

Twilio é uma plataforma de comunicações em nuvem para desenvolvedores que permite SMS programáveis. Recentemente, duas poderosas APIs de processamento de linguagem natural foram oferecidas como add-ons no mercado Twilio: IBM Watson Sentiment e IBM Watson Message Insights. Neste artigo, aprenda a construir e implementar um aplicativo Bluemix que exibe mensagens SMS em tempo real enriquecidas com APIs Watson que integram o Twilio programmable SMS, Watson Sentiment e Watson Message Insights Add-ons. Esse aplicativo poderá ser usado como um ponto de partida para construir seus próprios serviços de monitoramento de SMS personalizados.

O que você precisa para construir seu aplicativo

[Leia mais]
DatabaseCast: Pesquisas textuais, log e information retrieval

Olá, pessoal! Neste episódio, Mauro Pichiliani (Twitter | Blog), Wagner Crivelini (@wcrivelini) e o convidado Waldemar Neto mergulham de cabeça no texto para falar sobre pesquisas textuais, logs e information retrieval.

Você vai aprender é o que fuzzy matching, entender porque o LIKE e expressões regulares não vão salvar o dia, escolher o tênis para fazer exercícios, descobrir o que é a sigla ELK, ficar desconfiado com o que fazem com seus dados e discutir a polêmica: sistemas de recomendação ou a busca ajuda a converter mais no e-commerce?

[Leia mais]
DatabaseCast: Data science na prática

Olá, pessoal!

Neste episódio, Mauro Pichiliani (Twitter | Blog), Wagner Crivelini (@wcrivelini) e os convidados Diego Nogare (@diegonogare) e Tantravahi Aditya (tvaditya@gmail.com) tiram o microscópio da caixa para falar sobre data science (ciência de dados) na prática.

Hoje você vai aprender qual é o valor nutricional de uma quesadilha e um burrito, como ganhar dinheiro vendendo móveis, estudar de “grátis”, prever quando alguém está fazendo progresso ou tendo alguma dificuldade, diferenciar BI de data science e saber usar dados a seu favor junto com ferramentas científicas.

[Leia mais]
DatabaseCast: como trabalhar com GIS

Olá, pessoal! Neste episódio do DatabaseCast, Mauro Pichiliani (Twitter | Blog), Wagner Crivelini (@wcrivelini) e o convidado Gabriel Moreira (@gspmoreira) se perdem no meio do caminho falando sobre GIS.

Você vai saber o que é um teodolito, quem ainda tem um guia físico de ruas guardado, quais são as tecnologias de back-end e front-end para se trabalhar com GIS, porque um DATUM pode dar dor de cabeça e simpatizar com quem foi assistir ao filme cinquenta tons de cinza.

Não deixe de nos incentivar digitando o seu comentário no final deste artigo, mandando um e-mail …

[Leia mais]
DatabaseCast: Cientista de dados

Olá, pessoal! Neste episódio do DatabaseCast, Mauro Pichiliani (Twitter | Blog) e Wagner Crivelini (@wcrivelini) falam sobre ciência de dados com o convidado Marcelo Glauco (@mglauco). Você vai saber como um físico pode virar um cientista de dados, quem odeia selfies, o que adoção de animais tem a ver com dados e porque precisamos de psicologia na área de computação. Além de entender a importância de prestar a atenção no que um estatístico fala e como deixar a mamãe orgulhosa.

Não deixe de nos incentivar digitando o seu comentário no final deste artigo, mandando um e-mail …

[Leia mais]
DatabaseCast: Dashboards

Olá, pessoal! Neste episódio do DatabaseCast Mauro Pichiliani (Twitter | Blog) e Wagner Crivelini (@wcrivelini) ficam olhando para a tela junto com a convidada Viviane Ribeiro (@viviane_sql). Neste episódio, você vai saber como a interface de um BI pode ajudar os usuários, quais são os elementos visuais que mais confundem do que ajudam, como uma pizza pode não se redonda, quem gosta de visitar submarinos, como um triângulo pode dar muito dor de cabeça e mandar um olá para o cara que sempre pede para exportar para a planilha e imprimir o relatório.

Não deixe de nos incentivar …

[Leia mais]
Melhores de 2012 – Análise de dados na nuvem: duas boas opções de Big Data “NoSQL” para as PMEs

O que tivemos de mais interesse em 2012? Quais foram melhores artigos, as opiniões que geraram maiores discussões? Isso é o que você vai encontrar nessa seleção de artigos que fizemos especialmente para você: os melhores conteúdos de 2012. Já que final e início de ano é sempre um tempo propício para fazer um balanço do que passou e o planejamento para o que ainda virá, esperamos que os artigos publicados aqui te ajudem nisso!

Boas festas e feliz 2013! Um abraço da equipe de Redação do iMasters!

 

Algumas estimativas sugerem que até 2015 o universo digital crescerá para 8 zettabytes de dados (1 zettabyte = 1.000.000.000.000.000.000.000 bytes). Muito se tem escrito nos últimos anos sobre o “Big Data” e as implicações para o gerenciamento de informações e para a análise de dados. Simplificando, Big Data são os dados que são grandes demais para serem processados usando métodos …

[Leia mais]
Mostrando entradas 1 para 10