文档菜单
文档首页

MongoDB Spark 连接器

MongoDB Spark 连接器 为 MongoDB 和 Apache Spark 之间提供集成。

注意

MongoDB Spark 连接器 10.x 版本是一个全新的连接器,基于最新的 Spark API。安装并迁移到 10.x 版本来利用新的功能,例如与Spark 结构化流.

10.x 版本使用新的命名空间com.mongodb.spark.sql.connector.MongoTableProvider。这允许您在 10.x 版本的同时使用旧版本的连接器(3.x 和更早版本)。

有关新连接器及其优势的更多信息,请参阅MongoDB 宣布博客文章。

使用连接器,您可以访问所有 Spark 库以用于 MongoDB 数据集:用于 SQL 分析(得益于自动模式推断)、流、机器学习和图 API 的 Dataset。您还可以使用 Spark Shell 与连接器一起使用。

MongoDB Spark 连接器与以下版本的 Apache Spark 和 MongoDB 兼容

MongoDB Spark 连接器
Spark 版本
MongoDB 版本
10.4.0
3.1 至 3.5
4.0 或更高版本

下一步

开始使用 Spark 连接器