CDH 這個開源軟件套件在 Hadoop 集群系統中使用廣泛。它支持多樣化的工具,例如 Hive、Spark、HBase 等。然而,在安裝 CDH 期間,有時我們需要在其中一個節點上安裝 Oracle 數據庫,以便支持使用 Impala(一種 SQL 引擎)。本文將為您介紹如何在 CDH 集群中安裝 Oracle 數據庫,并為您提供詳細的步驟和實用的示例。
首先,我們需要在官網上下載 Oracle 數據庫軟件。對于 CDH 5.x 版本的用戶,建議下載 Oracle Database 11g Release 2(11.2.0.4)版本。當然,您也可以使用更新的版本來適配您所需要的 CDH 版本。在下載完成后,您需要將軟件復制到我們要安裝 Oracle 的節點上。使用以下命令行將軟件從本地傳輸到您的目標節點上:
scp /local/path/to/oracle/database/oracle11gR2.tar.gz user@destination:/remote/path/to/oracle/此時,許多可能因為缺少安裝依賴包而出現安裝失敗的問題。因此,下一步我們需要安裝一些 Oracle 數據庫需要的依賴包。其中一些非常重要的包如下:
yum install binutils compat-libcap1 compat-libstdc++-33 gcc-c++ glibc-devel \ ksh libgcc libstdc++ libstdc++-devel libaio libaio-devel make sysstat請注意,在上述命令安裝依賴包之前,我們需要升級 CentOS/EPEL 源。 接下來,我們將開始安裝 Oracle 數據庫。請按照以下步驟進行操作: 1.在遠程服務器上用超級用戶運行下面的命令,以創建必要的用戶和組:
useradd -d /home/oracle -m -s /bin/bash oracle groupadd dba usermod -a -G dba oracle2.將剛才傳輸到遠程節點的 oracle11gR2.tar.gz 文件復制到 Oracle 用戶的家目錄下,然后用解壓命令解壓縮:
cd /home/oracle tar xf oracle11gR2.tar.gz3.打開
/etc/sysctl.conf
文件,并將以下幾行添加到末尾:# Oracle-optimized kernel parameters fs.file-max = 6815744 kernel.sem = 250 32000 100 128 kernel.shmmni = 4096 kernel.shmall = 1073741824 kernel.shmmax = 4398046511104 net.core.rmem_default = 262144 net.core.rmem_max = 4194304 net.core.wmem_default = 262144 net.core.wmem_max = 10485764.使用以下命令編輯
/etc/security/limits.conf
文件,添加以下幾行:oracle soft nofile 1024 oracle hard nofile 65536 oracle soft nproc 2047 oracle hard nproc 163845.接下來,我們需要為 Oracle 數據庫設置環境變量。在 Oracle 用戶的家目錄下創建一個
.bash_profile
文件,并添加以下內容:# Oracle environment variables TMP=/tmp; export TMP TMPDIR=$TMP; export TMPDIR ORACLE_HOSTNAME=myhost; export ORACLE_HOSTNAME ORACLE_UNQNAME=orcl; export ORACLE_UNQNAME ORACLE_BASE=/home/oracle/app/oracle; export ORACLE_BASE ORACLE_HOME=$ORACLE_BASE/product/11.2.0.4/db_home1; export ORACLE_HOME LD_LIBRARY_PATH=$ORACLE_HOME/lib:/lib:/usr/lib:/usr/local/lib; export LD_LIBRARY_PATH CLASSPATH=$ORACLE_HOME/jlib:$ORACLE_HOME/rdbms/jlib; export CLASSPATH這里,“myhost”和“orcl”分別代表主機名和 Oracle 全局名稱。您可以根據自己的情況進行更改。如果您使用的是不同版本的 Oracle,您還需要修改您的 Oracle Home、Oracle Base 等變量,以適配您所使用的版本。 6.運行以下兩個命令以切換到 Oracle 用戶并啟動 Oracle 數據庫的安裝向導:
su - oracle ./runInstaller7.按照向導的指示進行操作,直到完成以安裝 Oracle 數據庫。請注意,在檢查所有必要條件時,它可能會顯示有一些問題(例如提示缺少必要的包等)。這時您需要安裝必要的包,并重新運行檢查操作,直到操作成功為止。 8.在安裝的最后階段,找到執行 root.sh 的部分并遵循其提示,使用 root 用戶進行操作。此操作將在系統中創建有關 Oracle 數據庫的一些重要信息,以及配置數據庫的網絡監聽器等內容。 至此,您已成功地在 CDH 集群中安裝了 Oracle 數據庫。我們可以開始測試它是否正常運行。在 Oracle 用戶的環境中,使用以下命令啟動數據庫:
sqlplus / as sysdba startup這時您可以在另一個終端中使用以下命令以檢查后臺進程是否已完成:
ps -ef | grep ora_ | grep -v grep如果一切正常,您將會看到一些能夠表明正在運行 Oracle 數據庫的進程。恭喜您,您已成功地在 CDH 集群中安裝了 Oracle 數據庫,并且可以開始使用 Impala 等工具了。