SparkSQL JDBC连接mysql的方法

要在SparkSQL中使用JDBC连接MySQL，首先需要添加MySQL的JDBC驱动包，然后在SparkSession中设置JDBC连接参数，最后使用spark.read.jdbc方法读取数据。

在Spark SQL中，我们可以通过JDBC连接器来连接MySQL数据库，以下是步骤：

（图片来源网络，侵删）

1、我们需要添加MySQL的JDBC驱动包到我们的项目中，如果你使用的是Maven项目，可以在pom.xml文件中添加以下依赖：

<dependency>
    <groupId>mysql</groupId>
    <artifactId>mysqlconnectorjava</artifactId>
    <version>8.0.15</version>
</dependency>

2、我们需要创建一个SparkSession对象，并启用Hive支持，因为JDBC连接器需要Hive的支持。

import org.apache.spark.sql.SparkSession;
SparkSession spark = SparkSession
    .builder()
    .appName("Spark SQL JDBC Connector Example")
    .config("spark.master", "local")
    .enableHiveSupport()
    .getOrCreate();

3、我们可以使用spark.read().jdbc()方法来从MySQL读取数据，并加载到DataFrame中。

String url = "jdbc:mysql://localhost:3306/database_name";
Properties connectionProperties = new Properties();
connectionProperties.put("user", "username");
connectionProperties.put("password", "password");
connectionProperties.put("driver", "com.mysql.jdbc.Driver");
Dataset<Row> jdbcDF = spark.read()
    .jdbc(url, "table_name", connectionProperties);

4、我们可以对DataFrame进行各种操作，如显示数据、过滤数据等。