Hive是基于Hadoop的一個數據倉庫工具,它能夠將數據放到Hadoop集群中,并使用SQL語句進行查詢。在Hive中,可以配置MySQL作為元數據存儲服務,本文將介紹如何配置Hive與MySQL。
首先,需要在Hive的配置文件hive-site.xml中添加以下配置:
<property> <name>javax.jdo.option.ConnectionURL</name> <value>jdbc:mysql://localhost:3306/hive?createDatabaseIfNotExist=true</value> </property> <property> <name>javax.jdo.option.ConnectionDriverName</name> <value>com.mysql.jdbc.Driver</value> </property> <property> <name>javax.jdo.option.ConnectionUserName</name> <value>hive</value> </property> <property> <name>javax.jdo.option.ConnectionPassword</name> <value>password</value> </property>
以上配置中,javax.jdo.option.ConnectionURL是連接MySQL的URL地址,其中localhost代表MySQL服務器IP地址,3306代表MySQL的端口號,hive代表數據庫名。ConnectionDriverName是驅動名稱,ConnectionUserName和ConnectionPassword分別是 MySQL數據庫的用戶名和密碼。
接下來,需要下載MySQL的JDBC驅動,并將它放到Hive的lib目錄下。
然后,需要在MySQL中創建Hive所需的數據庫和表:
CREATE DATABASE IF NOT EXISTS hive; USE hive; CREATE TABLE IF NOT EXISTS tbl_employee (EMPID INT, NAME STRING, AGE INT) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' STORED AS TEXTFILE;
以上腳本創建了hive數據庫,使用此數據庫之后,又創建了tbl_employee表用于存放數據。
最后,在Hive命令行中使用以下查詢語句,驗證Hive是否能夠連接MySQL:
SHOW DATABASES;
執行以上語句后,如果可以顯示MySQL中的hive數據庫,則表示 Hive 與 MySQL 連接成功。