在hive中,我們可以使用INSERT INTO語句將數據導出到MySQL數據庫。下面我們將介紹該過程步驟。
CREATE TABLE emp (id int, name string, salary double) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',';
LOAD DATA LOCAL INPATH '/home/hadoop/employee.csv' INTO TABLE emp;
首先我們創建了一個名為emp的表,并將數據存儲在CSV文件中。接下來使用以下語句將數據導出到MySQL數據庫。
INSERT INTO TABLE mysql_emp
SELECT id, name, salary
FROM emp;
CREATE EXTERNAL TABLE mysql_emp (id int, name string, salary double)
STORED BY 'org.apache.hadoop.hive.mysql.HiveMySQLStorageEngine'
WITH SERDEPROPERTIES ('hive.sql.database.type'='MYSQL', 'hive.sql.database.url'='jdbc:mysql://localhost:3306/hive', 'hive.sql.database.username'='hive', 'hive.sql.database.password'='hive')
TBLPROPERTIES ('hive.sql.table'='mysql_emp', 'hive.sql.database'='hive', 'hive.sql.create.version'='0', 'hive.sql.drop.version'='0');
SELECT * FROM mysql_emp;
首先我們創建一個名為mysql_emp的外部表。在創建外部表時,需要指定MySQL連接信息和表名稱。在指定MySQL連接信息時,我們需要提供MySQL的JDBC URL、用戶名和密碼。
接下來,我們使用INSERT INTO語句將emp表中的數據插入到mysql_emp表中。最后我們檢索mysql_emp表中的數據,以確認導出是否成功。
除此之外,我們還可以將數據導出到其他存儲介質中,比如HDFS、HBase等。