address comments

pan3793 · pan3793 · commit 5dcb4960c79a · 2025-11-10T19:58:02.000+08:00
diff --git a/sql/connect/client/jdbc/src/main/scala/org/apache/spark/sql/connect/client/jdbc/SparkConnectDatabaseMetaData.scala b/sql/connect/client/jdbc/src/main/scala/org/apache/spark/sql/connect/client/jdbc/SparkConnectDatabaseMetaData.scala
@@ -20,6 +20,7 @@ package org.apache.spark.sql.connect.client.jdbc
 import java.sql.{Array => _, _}
 
 import org.apache.spark.SparkBuildInfo.{spark_version => SPARK_VERSION}
+import org.apache.spark.sql.catalyst.util.QuotingUtils._
 import org.apache.spark.sql.connect
 import org.apache.spark.sql.connect.client.jdbc.SparkConnectDatabaseMetaData._
 import org.apache.spark.sql.functions._
@@ -99,8 +100,7 @@ class SparkConnectDatabaseMetaData(conn: SparkConnectConnection) extends Databas
   override def getTimeDateFunctions: String =
     throw new SQLFeatureNotSupportedException
 
-  override def getSearchStringEscape: String =
-    throw new SQLFeatureNotSupportedException
+  override def getSearchStringEscape: String = "\\"
 
   override def getExtraNameCharacters: String = ""
 
@@ -316,16 +316,19 @@ class SparkConnectDatabaseMetaData(conn: SparkConnectConnection) extends Databas
   private def getSchemasDataFrame(
       catalog: String, schemaPattern: String): connect.DataFrame = {
 
-    val schemaFilterClause =
-      if (isNullOrWildcard(schemaPattern)) "1=1" else s"TABLE_SCHEM LIKE '$schemaPattern'"
+    val schemaFilterClause = if (isNullOrWildcard(schemaPattern)) {
+      "TRUE"
+    } else {
+      s"TABLE_SCHEM LIKE '${escapeSingleQuotedString(schemaPattern)}'"
+    }
 
     def internalGetSchemas(
         catalogOpt: Option[String],
         schemaFilterClause: String): connect.DataFrame = {
       val catalog = catalogOpt.getOrElse(conn.getCatalog)
       // Spark SQL supports LIKE clause in SHOW SCHEMAS command, but we can't use that
       // because the LIKE pattern does not follow SQL standard.
-      conn.spark.sql(s"SHOW SCHEMAS IN `$catalog`")
+      conn.spark.sql(s"SHOW SCHEMAS IN ${quoteIdentifier(catalog)}")
         .select($"namespace".as("TABLE_SCHEM"))
         .filter(schemaFilterClause)
         .withColumn("TABLE_CATALOG", lit(catalog))
@@ -336,8 +339,8 @@ class SparkConnectDatabaseMetaData(conn: SparkConnectConnection) extends Databas
       val emptyDf = conn.spark.emptyDataFrame
         .withColumn("TABLE_SCHEM", lit(""))
         .withColumn("TABLE_CATALOG", lit(""))
-      conn.spark.catalog.listCatalogs().collect().map(_.name).map { catalog =>
-        internalGetSchemas(Some(catalog), schemaFilterClause)
+      conn.spark.catalog.listCatalogs().collect().map(_.name).map { c =>
+        internalGetSchemas(Some(c), schemaFilterClause)
       }.fold(emptyDf) { (l, r) => l.unionAll(r) }
     } else if (catalog == "") {
       // search only in current catalog
diff --git a/sql/connect/client/jdbc/src/test/scala/org/apache/spark/sql/connect/client/jdbc/SparkConnectDatabaseMetaDataSuite.scala b/sql/connect/client/jdbc/src/test/scala/org/apache/spark/sql/connect/client/jdbc/SparkConnectDatabaseMetaDataSuite.scala
@@ -69,6 +69,7 @@ class SparkConnectDatabaseMetaDataSuite extends ConnectFunSuite with RemoteSpark
       assert(metadata.storesLowerCaseQuotedIdentifiers === false)
       assert(metadata.storesMixedCaseQuotedIdentifiers === false)
       assert(metadata.getIdentifierQuoteString === "`")
+      assert(metadata.getSearchStringEscape === "\\")
       assert(metadata.getExtraNameCharacters === "")
       assert(metadata.supportsAlterTableWithAddColumn === true)
       assert(metadata.supportsAlterTableWithDropColumn === true)
@@ -253,22 +254,21 @@ class SparkConnectDatabaseMetaDataSuite extends ConnectFunSuite with RemoteSpark
     withConnection { conn =>
       implicit val spark: SparkSession = conn.asInstanceOf[SparkConnectConnection].spark
 
-      registerCatalog("testcat", TEST_IN_MEMORY_CATALOG)
+      registerCatalog("test`cat", TEST_IN_MEMORY_CATALOG)
 
-      spark.sql("USE testcat")
-      spark.sql("CREATE DATABASE IF NOT EXISTS testcat.t_db1")
-      spark.sql("CREATE DATABASE IF NOT EXISTS testcat.t_db2")
-      spark.sql("CREATE DATABASE IF NOT EXISTS testcat.test_db3")
+      spark.sql("CREATE DATABASE IF NOT EXISTS `test``cat`.t_db1")
+      spark.sql("CREATE DATABASE IF NOT EXISTS `test``cat`.t_db2")
+      spark.sql("CREATE DATABASE IF NOT EXISTS `test``cat`.t_db_")
 
-      spark.sql("USE spark_catalog")
       spark.sql("CREATE DATABASE IF NOT EXISTS spark_catalog.db1")
       spark.sql("CREATE DATABASE IF NOT EXISTS spark_catalog.db2")
-      spark.sql("CREATE DATABASE IF NOT EXISTS spark_catalog.db_")
+      spark.sql("CREATE DATABASE IF NOT EXISTS spark_catalog.test_db3")
 
       val metadata = conn.getMetaData
-      withDatabase("testcat.t_db1", "testcat.t_db2", "testcat.test_db3",
-        "spark_catalog.db1", "spark_catalog.db2", "spark_catalog.db_") {
 
+      // no need to care about "test`cat" because it is memory based and session isolated,
+      // also is inaccessible from another SparkSession
+      withDatabase("spark_catalog.db1", "spark_catalog.db2", "spark_catalog.test_db3") {
         // list schemas in all catalogs
         val getSchemasInAllCatalogs = (() => metadata.getSchemas) ::
           List(null, "%").map { database => () => metadata.getSchemas(null, database) } ::: Nil
@@ -280,11 +280,11 @@ class SparkConnectDatabaseMetaDataSuite extends ConnectFunSuite with RemoteSpark
               catalogDatabases === Seq(
                 ("spark_catalog", "db1"),
                 ("spark_catalog", "db2"),
-                ("spark_catalog", "db_"),
                 ("spark_catalog", "default"),
-                ("testcat", "t_db1"),
-                ("testcat", "t_db2"),
-                ("testcat", "test_db3"))
+                ("spark_catalog", "test_db3"),
+                ("test`cat", "t_db1"),
+                ("test`cat", "t_db2"),
+                ("test`cat", "t_db_"))
             }
           }
         }
@@ -300,20 +300,19 @@ class SparkConnectDatabaseMetaDataSuite extends ConnectFunSuite with RemoteSpark
               catalogDatabases === Seq(
                 ("spark_catalog", "db1"),
                 ("spark_catalog", "db2"),
-                ("spark_catalog", "db_"),
-                ("spark_catalog", "default"))
+                ("spark_catalog", "default"),
+                ("spark_catalog", "test_db3"))
             }
           }
         }
 
-        // list schemas with SQL pattern
+        // list schemas with schema pattern
         verifyGetSchemas { () => metadata.getSchemas(null, "db%") } { catalogDatabases =>
           // results are ordered by TABLE_CATALOG, TABLE_SCHEM
           assert {
             catalogDatabases === Seq(
               ("spark_catalog", "db1"),
-              ("spark_catalog", "db2"),
-              ("spark_catalog", "db_"))
+              ("spark_catalog", "db2"))
           }
         }
 
@@ -322,18 +321,25 @@ class SparkConnectDatabaseMetaDataSuite extends ConnectFunSuite with RemoteSpark
           assert {
             catalogDatabases === Seq(
               ("spark_catalog", "db1"),
-              ("spark_catalog", "db2"),
-              ("spark_catalog", "db_"))
+              ("spark_catalog", "db2"))
           }
         }
 
-        verifyGetSchemas { () => metadata.getSchemas(null, "db\\_") } { catalogDatabases =>
-          // results are ordered by TABLE_CATALOG, TABLE_SCHEM
-          assert {
-            catalogDatabases === Seq(
-              ("spark_catalog", "db_"))
-          }
+        // escape backtick in catalog, and _ in schema pattern
+        verifyGetSchemas {
+          () => metadata.getSchemas("test`cat", "t\\_db\\_")
+        } { catalogDatabases =>
+          assert(catalogDatabases === Seq(("test`cat", "t_db_")))
         }
+
+        // skip testing escape ', % in schema pattern, because Spark SQL does not
+        // allow using those chars in schema table name.
+        //
+        //   CREATE DATABASE IF NOT EXISTS `t_db1'`;
+        //
+        // the above SQL fails with error condition:
+        //   [INVALID_SCHEMA_OR_RELATION_NAME] `t_db1'` is not a valid name for tables/schemas.
+        //   Valid names only contain alphabet characters, numbers and _. SQLSTATE: 42602
       }
     }
   }