Databricks, Inc.创立于2013年,总部位于美国加州旧金山,在加拿大,英国,荷兰,新加坡,澳大利亚,德国,法国,日本,中国和印度运营,是一家大数据与AI公司,它与存储在公共云中的公司信息进行交互。
Databricks, Inc.美股百科
Databricks是2013年由加州大学伯克利分校(UCB)负责开发开源Apache Spark数据处理框架的团队创建的,他们为数据科学团队提供了一个统一的分析平台,以便与数据工程和业务部门合作构建数据产品。
Databricks公司还创建了Delta Lake,MLflow和Koalas,这是横跨数据工程,数据科学和机器学习的流行开源项目。Databricks开发了一个基于Web的平台以与Spark配合使用,该平台提供了自动化的群集管理和IPython样式的笔记本。 除了构建Databricks平台外,该公司还共同组织有关Spark的大规模开放式在线课程,并为Spark社区举办规模最大的会议-Data + AI Summit,前身为Spark Summit。
全球有5,000多家组织在使用Databricks。
Databricks产品:
Databricks开发和销售基于现代Lakehouse数据架构的云数据平台。 Databricks的lakehouse基于开放源代码Apache Spark框架,该框架允许用户对半结构化无模式数据运行分析查询。
Databricks的Delta引擎于2020年6月推出,它是一个新的查询引擎,它位于Delta Lake之上,以加速SQL处理并提高整体性能。它与Apache Spark和MLflow兼容,后者也是Databricks的开源项目。
2020年11月,Databricks引入了SQL Analytics,允许用户直接在数据湖上运行BI和分析报告。 分析师可以直接使用标准SQL查询数据集,也可以使用新产品连接器直接与流行的BI工具(如Tableau,Qlik,Looker和ThoughtSpot)集成。公司将Databricks用作数据工作负载的集中平台,例如机器学习,数据存储和处理,流分析和商业智能。
目前Databricks提供四种产品:
- Delta Lake——开源的数据湖产品。Delta Lake是建立在Spark SQL和存储在Databricks文件系统中的Parquet文件之上的存储层。通过使用差异(delta!)文件和特殊索引,Databricks为它的数据湖添加了重要的功能,使其具有更高的性能、与传统关系数据库相同的事务管理特性和ACID兼容性。这意味着可以将新数据添加到湖中,然后立即进行有效查询。
- MLflow——帮助数据团队使用机器学习的开源框架。MLflow是集成到统一数据分析平台(UDAP)中的,但是可以在开源代码的基础上与其他平台进行集成。MLflow可以用来协助机器学习实验和模型管理,可以记录不同算法和超参数配置,以及应用它们生成模型的准确性。MLflow还定义了一个模型持久化格式,这使模型可以共享。
- Koalas——为Spark和Pandos创建单一的机器框架,简化使用这两种工具的工作;
- Spark——开源分析引擎。
其中,MLflow和Delta Lake是2019年10月份在阿姆斯特丹的Spark+AI欧洲峰会上发布的新产品。
Databricks的统一数据分析平台(UDAP)是一个基于云进行管理和优化的Spark服务,可以直接从亚马逊云服务上获得,也可以从Azure云上以微软支持服务的形式获得。最近,Databricks向UDAP添加了上述新的功能,使其性能超越了Spark、Notebook和其他基本功能。
Databricks产品的开源版本都可以直接在网上下载,但是怎么使用这些产品来为我们工作却并不是一件容易的事情。Databricks以SAAS的形式向客户提供产品,并且负责解决使用中遇到的所有问题。当然,“订阅”这些服务是收费的。
Databricks, Inc.融资百科
- 2013年9月25日,A轮融资,Databricks获得 Andreessen Horowitz 领投,Alfred Chuang(个人)跟投的1400万美元投资。
- 2014年6月30日,B轮融资,Databricks获得 New Enterprise Associates 领投,Andreessen Horowitz和DCVC跟投的3300万美元投资。
- 2016年12月15日,C轮融资,Databricks获得 New Enterprise Associates 领投,Andreessen Horowitz和SineWave Ventures跟投的6000万美元投资。
- 2017年8月22日,D轮融资,Databricks获得 Andreessen Horowitz 领投,New Enterprise Associates、Battery Ventures、Geodesic Capital和Green Bay Ventures跟投的1.4亿美金投资。
- 2019年2月5日,E轮融资,Databricks获得 Andreessen Horowitz 领投,New Enterprise Associates、Battery Ventures、Coatue、Microsoft等跟投的2.5亿美金投资。
- 2019年10月22日,F轮融资,Databricks获得 Andreessen Horowitz 领投,New Enterprise Associates、T. Rowe Price、Coatue、Tiger Global Management等跟投的4.0亿美金投资。
- 2021年2月1日,G轮融资,Databricks获得 Franklin Templeton Investments 领投,New Enterprise Associates、T. Rowe Price、Salesforce Ventures、Andreessen Horowitz、Tiger Global Management等22家机构跟投的10.0亿美金投资。
- 2021年8月31日,H轮融资,Databricks获得Counterpoint Global领投,New Enterprise Associates、Andreessen Horowitz、Insight Partners、Tiger Global Management、Gaingels等25家机构跟投的16亿美金投资。
- 2023年3月3日,Databricks完成H+轮融资,Vantage Legacy Capital独家参与。
- 2023年7月31日,Databricks获得Irving Investors独家参与的二级市场投资。
- 2023年9月14日,Databricks完成T. Rowe Price领投的5亿美金 I 轮融资,Andreessen Horowitz、Tiger Global Management、Fidelity Management and Research Company、GIC等13家机构跟投。
Databricks, Inc.历史百科
- Databricks创立于2013年,源自加州大学伯克利分校的AMPLab项目,该项目涉及制作Apache Spark,Apache Spark是在Scala之上构建的开源分布式计算框架。
- 2017年11月,该公司通过集成Azure Databricks被宣布为Microsoft Azure上的第一方服务商。该公司深深扎根于开源,并启动了Delta Lake,这是一个开放源代码项目,旨在为机器学习和其他数据科学用例带来可靠性的数据湖。
- Databricks于2020年6月收购了Redash,这是一个开放源代码工具,旨在帮助数据科学家和分析师可视化并构建其数据的交互式仪表板。
- 2021年2月,Databricks与Google Cloud合作,提供了与Google Kubernetes Engine和Google BigQuery平台的集成。
- 2024年3月,Databricks旗下Databricks Ventures参与了Unstructured Technologies, Inc.的4000万美元B轮融资。
Databricks, Inc.美股投资
等待Databricks, Inc. IPO上市。
评论