歡迎來到Linux教程網
Linux教程網
Linux教程網
Linux教程網
您现在的位置: Linux教程網 >> UnixLinux >  >> Linux綜合 >> 學習Linux

centos7.2安裝dcos

centos7.2安裝dcos


熱度4 評論 187 www.BkJia.Com  網友分享於:  2017-02-10 07:02:44     浏覽數41232次

centos7.2安裝dcos


1. 前言

對於容器編排系統,前段時間主要研究kubernetes,現在實驗室要用dcos,所以在實驗室集群上搭建了該系統,dcos版本為1.8.6。
使用的系統為centos7.2,機器使用情況如下表所示,實驗室集群沒有聯外網。

機器ip作用10.107.18.35單獨一台boot節點10.107.19.1單獨一台master節點10.107.13.1504台slave節點10.107.19.24台slave節點10.107.19.34台slave節點10.107.18.394台slave節點

為了避免安裝失敗時需要重新啟動系統,這裡可以在完成第7節,安裝完成Docker後將所有機器系統備份,出現問題時將系統還原到備份點。需要主要的是還原後要重新做第5步時間同步。系統備份參考http://blog.csdn.net/yuanfang_way/article/details/54383616

2. 本文分析內容安排

1.關閉firewalld和selinux
2.ssh免密碼登錄
3.時間同步
4.安裝overlay模塊
5.安裝docker
6.安裝dcos

3. 關閉firewalld和selinux

  • 所有機器上執行systemctl stop firewalld && systemctl disable firewalld
    執行firewall-cmd --status查看firewalld是否成功關閉,應該顯示not running
  • 所有機器執行setenforce 0,sed -i s/SELINUX=enforcing/SELINUX=disabled/g /etc/selinux/config,重啟後輸入sestatus查看selinux狀態,此時應該顯示disabled

4. ssh免密碼登錄

在boot節點上執行ssh-keygen -t rsa生成密鑰
執行ssh-copy-id -i 10.107.x.x分別將私鑰復制到其他要免密鑰登陸的機器

5. 時間同步

參考http://blog.csdn.net/yuanfang_way/article/details/53959591

6. 安裝overlay模塊

執行命令

tee /etc/modules-load.d/overlay.conf <<-'EOF'overlayEOF

並重啟將overlay模塊加載如系統中,並執行lsmod | grep overlay查看是否加載成功,成功應該顯示overlay 42451 0

7. 安裝docker

首先,通過rpm或者yum install的方式安裝docker,在沒網的情況下需要先下載docker安裝相關的rpm包;之後,設置docker的存儲為overlay,具體應該執行如下腳本:

mkdir -p /etc/systemd/system/docker.service.d && tee /etc/systemd/system/docker.service.d/override.conf <<- EOF[Service]ExecStart=ExecStart=/usr/bin/docker daemon --storage-driver=overlay EOF

改變配置後需要執行systemctl daemon-reload命令使配置生效; 這時便可以啟動docker了,如下:

systemctl start dockersystemctl enable docker

最後,運行docker info命令查看是否正常安裝docker,並且存儲用的是overlay,正確情況時顯示如下圖

8. 安裝dcos

  1. 在boot節點上下載dcos的installer:dcos_generate_config.sh(大約726MB),同時在與dcos_generate_config.sh文件同級目錄下新建genconf目錄,我是在/home/dcos目錄下建的 mkdir -p genconf cd genconf
  2. 在genconf中新建一個ip-detect文件,用於探測集群中節點的ip,我使用的文件內容為

    #!/bin/bashecho $(ip addr s | grep inet | grep 10.107 | awk -F' ' '{print $2}'|  awk -F'/' '{print $1}')

    這裡不能寫錯,因為該文件內容最終會被拷貝到master和agent節點的/opt/mesosphere/bin/detect_ip中,在第9步啟動dcos服務時用來探測ip。如果,寫錯將不能正常啟動集群,報如下錯誤

    time="2017-01-13T00:57:22+08:00" level=info msg="/opt/mesosphere/etc/endpoints_config.json not found" time="2017-01-13T00:57:22+08:00" level=error msg="Could not detect IP: fork/exec /opt/mesosphere/bin/detect_ip: exec format error" time="2017-01-13T00:57:22+08:00" level=error msg="Could not get mesos node id: Get http://:5051/state: dial tcp :5051: getsockopt: connection refused" time="2017-01-13T00:57:22+08:00" level=fatal msg="Found unhealthy systemd units" 
  3. 在genconf中新建config.yaml文件,用於集群master以及agent節點的配置,我所用集群的配置為: agent_list: <ul><li>10.107.19.2</li> <li>10.107.19.3</li> <li>10.107.18.39</li> <li>10.107.13.150 auth_enabled: false bootstrap_url: file:///opt/dcos_install_tmp cluster_name: DC/OS exhibitor_storage_backend: static ip_detect_path: genconf/ip-detect master_discovery: static master_list:</li> <li>10.107.19.1 process_timeout: 10000 resolvers:</li> <li>8.8.8.8</li> <li>8.8.4.4 ssh_key_path: genconf/ssh_key ssh_port: 22 ssh_user: root telemetry_enabled: false oauth_enabled: false
  4. 將SSH key拷貝的genconf目錄,具體命令為cp /root/.ssh/id_rsa genconf/ssh_key && chmod 0600 genconf/ssh_key
  5. 運行bash dcos_generate_config.ee.sh --genconf命令創建安裝文件,並提取出為集群提供文件的docker容器,運行完這一步後dcos下的目錄結構如下圖:
  6. 運行bash dcos_generate_config.ee.sh --install-prereqs安裝dcos需要的依賴環境。但是,如果集群沒有聯網,那麼在運行此命令前需要首先在master和agent節點上運行yum install -y tar xz unzip curl ipset安裝依賴,否則會出錯。這一步運行成功後屏幕輸出如下圖,其中提示的紅色的錯誤是由於集群沒有聯網導致的,可以直接忽略。
  7. 檢測各節點是否已達到了安裝部署dcos的全部要求bash dcos_generate_config.ee.sh --preflight,boot節點會檢查其他節點的系統環境符不符合安裝要求,是不是有配置錯誤,或者缺包、版本不對等問題。運行成功後證明各機器達到了部署dcos的要求,屏幕輸出如下,其中紅色錯誤依舊是未聯網導致的,可以忽略。
  8. 正式安裝bash dcos_generate_config.ee.sh --deploy,在上一步環境檢查順利通過以後,執行deploy,其實就是從boot節點把安裝鏡像下發到各個節點而已,上一步沒問題這一步一般也不會出錯。運行成功後證明各機器已經成功安裝dcos,屏幕輸出如下圖,紅色錯誤依舊忽略。
  9. 確保服務啟動並且正常運行bash dcos_generate_config.ee.sh --postflight,這步其實就是boot去各個節點把docker鏡像拉起來,DCOS的那些組件像mesos master 、slave 、marathon、mesos-dns等都是運行在docker裡,另外具體配置信息也是boot節點通過環境變量這種方式幫你注入進去,這一步一般也不會出現問題。運行成功後dcos服務已經啟動,屏幕輸出如下圖,護色錯誤依舊忽略。
  10. dcos服務監控 監控dcos服務的網址為http://<master-public-ip>:8181/exhibitor/v1/ui/index.html,如下圖所示,當Hostname前面的圓形的狀態圖標為綠色時,代表DC/OS的接口已經可用了
  11. 登陸DC/OS 登陸DC/OS系統的接口為http://<public-master-ip>/,登陸後界面如下圖

注意:如果安裝過程中出現錯誤需重新安裝的話,需要清除已經安裝的文件。具體做法是新建一個uninstall.sh文件,文件內容如下,將該文件改為可執行文件,然後執行即可。

/opt/mesosphere/bin/pkgpanda uninstall && \rm -rf /opt/mesosphere /var/lib/mesos /var/lib/dcos /var/lib/zookeeper /var/log/mesos /etc/mesosphere /var/lib/mesosphere && \rm -rf /etc/profile.d/dcos.sh /etc/systemd/journald.conf.d/dcos.conf /etc/systemd/system/dcos-cfn-signal.service /etc/systemd/system/dcos-download.service /etc/systemd/system/dcos-link-env.service /etc/systemd/system/dcos-setup.service /etc/systemd/system/multi-user.target.wants/dcos-setup.service /etc/systemd/system/multi-user.target.wants/dcos.target

9. 作者介紹

梁明遠,國防科大並行與分布式計算國家重點實驗室(PDL)應屆研究生,14年入學伊始便開始接觸docker,准備在余下的讀研時間在docker相關開源社區貢獻自己的代碼,畢業後准備繼續從事該方面研究。郵箱:[email protected]

http://www.bkjia.com/Linuxjc/1192003.html TechArticle

Copyright © Linux教程網 All Rights Reserved