Databricks

Databricks
upright=!Artigos sem imagens
Criação
Forma jurídica
Sede social
Sector de atividade
Efectivos
4 000 ()
Fundadores
Ali Ghodsi (en)
Ion Stoica (en)
Reynold Xin (en)
Matei Zaharia (en)
Direção
Ali Ghodsi (en) (a partir de )
Presidente
Ion Stoica (en) (a partir de )
Receita bruta
1 000 000 000 $ ()
Website

A Databricks, Inc. é uma empresa americana de software sediada em São Francisco. [1] Foi fundada em 2013 pelos criadores originais do Apache Spark. [2] Oferece uma plataforma baseada na nuvem para análise de dados e inteligência artificial. [3]

A Databricks desenvolveu a arquitetura 'data lakehouse', que combina elementos de data warehouses e data lakes para gerenciar dados estruturados e não estruturados. [4] A empresa desenvolve o Delta Lake, um projeto de código aberto que adiciona suporte a transações ACID em data lakes. [5]

História

A databricks surgiu do projeto AMPLab na Universidade da Califórnia, Berkeley, envolvido na criação do Apache Spark, uma estrutura de computação distribuída de código aberto construída sobre Scala. A empresa foi fundada por Ali Ghodsi, Andy Konwinski, Arsalan Tavakoli-Shiraji, Ion Stoica, Matei Zaharia,[6] Patrick Wendell e Reynold Xin.

Em novembro de 2017, a empresa foi anunciada como um serviço primário no Microsoft Azure por meio da integração Azure Databricks.[7]

A empresa desenvolve o Delta Lake, um projeto de código aberto destinado a trazer confiabilidade aos data lakes para aprendizado de máquina e outros usos em ciência de dados.[8]

Em junho de 2020, a Databricks adquiriu o Redash, uma ferramenta de código aberto projetada para ajudar cientistas e analistas de dados a visualizar e criar painéis interativos de seus dados.[9]

Em fevereiro de 2021, juntamente com o Google Cloud, a Databricks começou uma integração com o Google Kubernetes Engine e a plataforma BigQuery do Google.[10] A Fortune classificou o Databricks como um dos melhores grandes "Locais de Trabalho para Millennials" em 2021.[11] Na época, a empresa disse que mais de 5.000 organizações usavam seus produtos.[12]

Em agosto de 2021, a Databricks terminou sua oitava rodada de financiamento levantando US$ 1,6 bilhão, com uma avaliação da empresa em US$ 38 bilhões.[13]

Em outubro de 2021, a Databricks fez sua segunda aquisição da empresa alemã sem código 8080 Labs. 8080 Labs é a desenvolvedora de bamboolib, uma ferramenta de exploração de dados que não requer codificação para usar.[14]

Aquisições

Em junho de 2020, a Databricks comprou a Redash, uma ferramenta de código aberto para visualização de dados e construção de painéis interativos. [15] Em 2021, adquiriu a empresa alemã de desenvolvimento sem código 8080 Labs, cujo produto, bamboolib, permitia a exploração de dados sem qualquer programação. [16] Em maio de 2023, a Databricks adquiriu o grupo de segurança de dados Okera, ampliando as capacidades de governança de dados da Databricks. [17] Em junho, adquiriu a startup de IA generativa de código aberto MosaicML por US$ 1,4 bilhão.  [18] [19] Em outubro, a Databricks comprou a startup de replicação de dados Arcion por US$ 100 milhões. [20] Em 2024, a Databricks comprou a startup de gerenciamento de dados Tabular por mais de US$ 1 bilhão. [21]

Em março de 2023, em resposta à popularidade do ChatGPT da OpenAI, a empresa lançou um modelo de linguagem de código aberto, chamado Dolly em homenagem à ovelha Dolly, que os desenvolvedores poderiam usar para criar chatbots personalizados. Dolly tem apenas 6 bilhões de parâmetros. [22] A Databricks afirmou que Dolly tinha "capacidade de seguir instruções semelhante ao ChatGPT", mas não divulgou testes de benchmark formais comparando-o ao ChatGPT. [23] [24] [25]

A Databricks reportou uma receita de US$ 1,6 bilhões para o ano fiscal de 2023, demonstrando crescimento em relação ao ano anterior. [26]

Em 2025, a Databricks adquiriu uma startup de banco de dados sem servidor, a Neon, [27] por cerca de US$ 1 bilhão. [28]

Financiamento

Em setembro de 2013, a Databricks anunciou que levantou US$ 13,9 milhões da Andreessen Horowitz e disse que pretendia oferecer uma alternativa ao sistema MapReduce do Google.[29][30] A Microsoft foi um investidor notável da Databricks em 2019, participando da Série E da empresa por um valor não especificado.[31][32] A empresa levantou US$ 1,9 bilhão em financiamento, incluindo uma série G de US$ 1 bilhão liderada por Franklin Templeton em uma avaliação pós-money de US$ 28 bilhões em fevereiro de 2021. Outros investidores incluem Amazon Web Services, CapitalG (uma empresa de capital de crescimento sob Alphabet, Inc.) e Salesforce Ventures.[12]

Rodadas de financiamento
Series Encontro Valor (milhões de dólares) Investidores Líderes
UMA 2013 13,9[29] Andreessen Horowitz
B 2014 33[33] Novos Associados Empresariais
C 2016 60[34] Novos Associados Empresariais
D 2017 140[35] Andreessen Horowitz
E fevereiro de 2019 250[36] Andreessen Horowitz
F Outubro de 2019 400[37] Andreessen Horowitz
G Janeiro de 2021 1.000[38] Investimentos Franklin Templeton
H Agosto de 2021 1.600[39] Morgan Stanley

Produtos

A Databricks desenvolve e vende uma plataforma de dados em nuvem usando o termo de marketing "lakehouse", um portmanteau baseado nos termos "data warehouse" e "data lake".[40] O lakehouse do Databricks é baseado na estrutura Apache Spark de código aberto que permite consultas analíticas em dados semiestruturados sem um esquema de banco de dados tradicional.[41]

O Delta Engine da Databricks foi lançado em junho de 2020 como um novo mecanismo de consulta que se sobrepõe ao Delta Lake para aumentar o desempenho da consulta.[42] É compatível com Apache Spark e MLflow, que também são projetos de código aberto da Databricks.[43]

Em novembro de 2020, a Databricks introduziu o Databricks SQL (anteriormente conhecido como SQL Analytics) para executar relatórios de análise e inteligência de negócios em data lakes. Os analistas podem consultar conjuntos de dados diretamente com SQL padrão ou usar conectores de produto para integrar diretamente com ferramentas de inteligência de negócios como Tableau, Qlik, Looker e ThoughtSpot.[44]

A Databricks também oferece uma plataforma para outras cargas de trabalho, incluindo aprendizado de máquina, armazenamento e processamento de dados, análise de streaming e inteligência de negócios.[45]

A empresa também criou Delta Lake, MLflow e Koalas, projetos de código aberto que abrangem engenharia de dados, ciência de dados e aprendizado de máquina.[46] Além de construir a plataforma Databricks, a empresa co-organizou grandes cursos online abertos sobre o Spark[47] e uma conferência para a comunidade Spark chamada Data + AI Summit,[48] anteriormente conhecida como Spark Summit.

Operações

A Databricks está sediada em São Francisco.[49]

Referências

  1. staff, CNBC com (16 de junho de 2020). «36. Databricks». CNBC (em inglês). Consultado em 8 de abril de 2021. Cópia arquivada em 24 de dezembro de 2022 
  2. Saul, Derek (14 de setembro de 2023). «Top IPO Prospect Databricks Scores $43 Billion Valuation Thanks To $500 Million Funding Round Including AI Titan Nvidia». Forbes. Consultado em 26 de março de 2024. Cópia arquivada em 4 de setembro de 2024 
  3. Sullivan, Mark (19 de março de 2024). «How Databricks is helping customers develop their own customized AI models». Fast Company. Consultado em 19 de março de 2024 
  4. Clark, Lindsay (16 de novembro de 2023). «Databricks' lakehouse becomes foundation under fresh layer of AI dreams». The Register. Consultado em 16 de novembro de 2023. Cópia arquivada em 4 de setembro de 2024 
  5. «Databricks launches Delta Lake, an open source data lake reliability project». VentureBeat (em inglês). 24 de abril de 2019. Consultado em 6 de abril de 2021. Cópia arquivada em 24 de março de 2022 
  6. Zaharia, Matei. «Matei Zaharia». Consultado em 16 de agosto de 2016 
  7. «Microsoft makes Databricks a first-party service on Azure». TechCrunch (em inglês). Consultado em 6 de abril de 2021 
  8. «Databricks launches Delta Lake, an open source data lake reliability project». VentureBeat (em inglês). 24 de abril de 2019. Consultado em 6 de abril de 2021 
  9. «Databricks acquires Redash, a visualizations service for data scientists». TechCrunch (em inglês). Consultado em 6 de abril de 2021 
  10. «Databricks brings its lakehouse to Google Cloud». TechCrunch (em inglês). Consultado em 18 de fevereiro de 2021 
  11. «100 Best Large Workplaces for Millennials». Fortune 
  12. a b Konrad, Alex (2 de fevereiro de 2021). «Databricks Raises $1 Billion At $28 Billion Valuation, With The Cloud's Elite All Buying In». Forbes (em inglês). Consultado em 29 de julho de 2021 
  13. Mellor, Chris (1 de setembro de 2021). «Databricks raises data lake of cash at monstrous $38bn valuation». Blocks & Files. Consultado em 4 de setembro de 2021 
  14. Eric Rosenbaum (6 de outubro de 2021). «$38 billion software start-up Databricks makes acquisition to leave code behind». CNBC. Consultado em 20 de fevereiro de 2022 
  15. «Databricks acquires Redash, a visualizations service for data scientists». TechCrunch (em inglês). 24 junho 2020. Consultado em 6 de abril de 2021 
  16. Eric Rosenbaum (6 de outubro de 2021). «$38 billion software start-up Databricks makes acquisition to leave code behind». CNBC. Consultado em 20 de fevereiro de 2022. Cópia arquivada em 6 de outubro de 2021 
  17. Palazzolo, Stephanie (3 de maio de 2023). «Exclusive: $38 billion data and AI darling Databricks acquires security startup Okera»Subscrição paga é requerida. Business Insider. Cópia arquivada em 3 de maio de 2023 
  18. Datta, Tiyashi; Hu, Krystal (26 de junho de 2023). «Databricks strikes $1.3 billion deal for generative AI startup MosaicML». Reuters. Consultado em 27 de junho de 2023. Cópia arquivada em 26 de junho de 2023 
  19. Council, Stephen (26 de junho de 2023). «SF tech firm Databricks to buy 2-year-old startup for $21 million per employee». SFGATE. Consultado em 27 de junho de 2023. Cópia arquivada em 26 de junho de 2023 
  20. «After $43B valuation, Databricks acquires data replication startup Arcion for $100M». TechCrunch (em inglês). 23 de outubro de 2023. Consultado em 23 de outubro de 2023 
  21. Galloni, Allessandra, ed. (5 junho 2024). «Databricks to buy data management firm Tabular for over $1 bln». Reuters 
  22. Goldman, Sharon (24 de março de 2023). «Databricks debuts ChatGPT-like Dolly, a clone any enterprise can own». VentureBeat. Cópia arquivada em 11 de abril de 2023 
  23. «Hello Dolly: Democratizing the magic of ChatGPT with open models». Databricks (em inglês). 23 de março de 2023. Consultado em 1 de janeiro de 2026 
  24. Hu, Krystal; Nellis, Stephen (24 de março de 2023). «Databricks pushes open-source chatbot as cheaper ChatGPT alternative». Reuters. Cópia arquivada em 25 de março de 2023 
  25. Loften, Angus (24 de março de 2023). «Databricks Launches 'Dolly,' Another ChatGPT Rival»Subscrição paga é requerida. The Wall Street Journal. Cópia arquivada em 24 de março de 2023 
  26. Wilhelm, Ron Miller and Alex (7 março 2024). «Databricks keeps marching forward with $1.6B in revenue». TechCrunch. Consultado em 8 março 2024. Cópia arquivada em 12 de março de 2024 
  27. «Databricks Agrees to Acquire Neon to Deliver Serverless Postgres for Developers + AI Agents». Databricks (em inglês). 13 de maio de 2025. Consultado em 16 de maio de 2025 
  28. Novet, Jordan (14 de maio de 2025). «Databricks is buying database startup Neon for about $1 billion». CNBC (em inglês). Consultado em 16 de maio de 2025 
  29. a b Harris, Derrick (25 de setembro de 2013). «Databricks raises $14M from Andreessen Horowitz, wants to take on MapReduce with Spark». Consultado em 28 de setembro de 2014 
  30. Lorica, Ben (25 de setembro de 2013). «Databricks aims to build next-generation analytic tools for Big Data». O'Reilly Media. Consultado em 28 de setembro de 2014 
  31. «Databricks raises $250M at a $2.75B valuation for its analytics platform». TechCrunch (em inglês). Consultado em 8 de abril de 2021 
  32. Novet, Jordan (5 de fevereiro de 2019). «Microsoft used to scare start-ups but is now an 'outstandingly good partner,' says Silicon Valley investor Ben Horowitz». CNBC (em inglês). Consultado em 6 de abril de 2021 
  33. Miller, Ron (30 de junho de 2014). «Databricks Snags $33M In Series B And Debuts Cloud Platform For Processing Big Data». TechCrunch. Consultado em 28 de setembro de 2014 
  34. Shieber, Jonathan. «Databricks raises $60 million to be big data's next great leap forward». TechCrunch. Consultado em 16 de dezembro de 2016 
  35. «Databricks Secures $140 Million to Accelerate Analytics and Artificial Intelligence in the Enterprise». Databricks (em inglês). Consultado em 16 de maio de 2019 
  36. «Databricks' $250 Million Funding Supports Explosive Growth and Global Demand for Unified Analytics; Brings Valuation to $2.75 Billion». Databricks (em inglês). Consultado em 5 de fevereiro de 2019 
  37. «Databricks announces $400M round on $6.2B valuation as analytics platform continues to grow». TechCrunch (em inglês). Consultado em 24 de outubro de 2019 
  38. «Databricks raises $1B at $28B valuation as it reaches $425M ARR». Tech Crunch (em inglês). Consultado em 14 de fevereiro de 2021 
  39. «Databricks raises $1.6B at $38B valuation as it blasts past $600M ARR». Tech Crunch (em inglês). Consultado em 1 de julho de 2021 
  40. Michael, Armbrust; Ghodsi, Ali; Xin, Reynold; Zaharia, Matei (janeiro de 2021). «Lakehouse: A New Generation of Open Platforms that Unify Data Warehousing and Advanced Analytics» (PDF). Conference on Innovative Data Systems Research. Consultado em 29 de julho de 2021 
  41. «With massive $1B infusion, Databricks takes aim at IPO and rival Snowflake». SiliconANGLE (em inglês). 1 de fevereiro de 2021. Consultado em 8 de abril de 2021 
  42. «Databricks Cranks Delta Lake Performance, Nabs Redash for SQL Viz». Datanami. 24 de junho de 2020. Consultado em 8 de abril de 2021 
  43. «Databricks launches Delta Lake, an open source data lake reliability project». VentureBeat (em inglês). 24 de abril de 2019. Consultado em 8 de abril de 2021 
  44. «Databricks launches SQL Analytics». TechCrunch (em inglês). Consultado em 8 de abril de 2021 
  45. Brust, Andrew. «Databricks, champion of data "lakehouse" model, closes $1B series G funding round». ZDNet (em inglês). Consultado em 8 de abril de 2021 
  46. «The Two Sigma Ventures Open Source Index». Two Sigma Ventures (em inglês). Consultado em 8 de abril de 2021 
  47. «Databricks to run two massive online courses on Apache Spark». Databricks (em inglês). 2 de dezembro de 2014. Consultado em 16 de dezembro de 2016 
  48. «Data + AI Summit». Databricks (em inglês). Consultado em 8 de abril de 2021 
  49. staff, CNBC com (16 de junho de 2020). «36. Databricks». CNBC (em inglês). Consultado em 8 de abril de 2021