准备工作
1、基础环境
ceph-admin ceph-mon 为同一台服务器ceph-osd1 为一台服务器ceph-osd2 为另一台服务器
2、关闭防火墙
# systemctl stop firewalld.service# systemctl disable firewalld.service
3、关闭Selinux
# sed -i 's/SELINUX=enforcing/SELINUX=disabled/' /etc/selinux/config# setenforce 0
重启服务器
4、配置 Yum源
# yum install wget vim curl -y# yum clean all# mkdir /etc/yum.repos/repo# cd /etc/yum.repos/# mv *.repo repo/下载阿里云的Base源# wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo下载阿里云的epel源# wget -O /etc/yum.repos.d/epel.repo http://mirrors.aliyun.com/repo/epel-7.repo# sed -i '/aliyuncs/d' /etc/yum.repos.d/CentOS-Base.repo# sed -i '/aliyuncs/d' /etc/yum.repos.d/epel.repo添加ceph源# vim /etc/yum.repos.d/ceph.repo[ceph]name=cephbaseurl=http://mirrors.aliyun.com/ceph/rpm-jewel/el7/x86_64/gpgcheck=0priority=1[ceph-noarch]name=cephnoarchbaseurl=http://mirrors.aliyun.com/ceph/rpm-jewel/el7/noarch/gpgcheck=0priority=1[ceph-source]name=Ceph source packagesbaseurl=http://mirrors.aliyun.com/ceph/rpm-jewel/el7/SRPMSenabled=1gpgcheck=1type=rpm-mdgpgkey=https://mirrors.aliyun.com/ceph/keys/release.ascpriority=1缓存yum 元数据# yum makecache
5、同步时间
将所有节点的时间进行校对
# yum install ntp ntpdate配置方式比较简单,略过...
6、将各个节点的主机名添加到各个节点的Hosts文件中
# cat /etc/hosts192.168.203.100 ceph-admin192.168.203.150 ceph-osd1192.168.203.200 ceph-osd2
7、配置Ssh 免密码 登陆
# ssh-keygen -t rsa
一路回车,直到完成
将 密码拷贝到其他各个服务器
# ssh-copy-id ceph-admin# ssh-copy-id ceph-osd1# ssh-copy-id ceph-osd2
安装Ceph
安装软件(在Ceph Admin节点上,以Root用户安装)
# mkdir ceph-cluster# cd ceph-cluster# yum install ceph ceph-deploy注:如果在安装过程中遇到问题,需要重新开始安装,执行以下命令来清空配置(新安装的不需要操作)下面的命令会将安装的包卸载掉# ceph-deploy purge ceph-admin ceph-osd1 ceph-osd2下面的命令会清除数据# ceph-deploy purgedata ceph-admin ceph-osd1 ceph-osd2下面的命令清除key# ceph-deploy forgetkeys
使用Ceph-Deploy 为所有节点安装Ceph
# ceph-deploy install ceph-admin ceph-osd1 ceph-osd2
创建监控节点
# ceph-deploy new ceph-admin
命令执行之后会在当前目录生成ceph.conf文件,打开文件增加一行内容(表示有两个osd)
osd pool default size = 2# ceph-deploy --overwrite-conf mon create ceph-admin
注:如果监控节点比较多,请注意查看显示的信息是否正确
初始化监控节点
# ceph-deploy mon create-initial
查看当前监控器的状态(在监控机器上执行)
# ceph daemon mon.`hostname` mon_status{ "name": "adm", "rank": 0, "state": "leader", "election_epoch": 3, "quorum": [ 0 ], "outside_quorum": [], "extra_probe_peers": [], "sync_provider": [], "monmap": { "epoch": 1, "fsid": "7fe7736b-3ea6-4c8a-b3bd-81f9355a51c6", "modified": "2017-08-27 15:25:30.486560", "created": "2017-08-27 15:25:30.486560", "mons": [ { "rank": 0, "name": "adm", "addr": "192.168.203.153:6789\/0" } ] }}
部署OSD
为存储节点osd分配磁盘空间(在osd1和osd2 分别创建文件夹,并给予权限)# mkdir /data# chwon ceph.ceph -R /data
通过ceph-admin 节点的ceph-deploy 开启osd进程,并激活
# ceph-deploy gatherkeys ceph-admin ceph-mon1 ceph-mon2 ceph-mon3 ceph-osd1 ceph-osd2# ceph-deploy --overwrite-conf osd prepare ceph-osd1:/data ceph-osd2:/data# ceph-deploy osd activate ceph-osd1:/data ceph-osd2:/data
把ceph-admin节点的配置文件与keying同步至其他节点
# ceph-deploy admin ceph-admin ceph-osd1 ceph-osd2# chmod +r /etc/ceph/ceph.client.admin.keyring
如果以上步骤没有报错误,那么基本上ceph就安装完了。
查看 集群健康命令
# ceph -s cluster 7fe7736b-3ea6-4c8a-b3bd-81f9355a51c6 health HEALTH_OK monmap e1: 1 mons at {adm=192.168.203.153:6789/0} election epoch 3, quorum 0 adm osdmap e27: 2 osds: 2 up, 2 in flags sortbitwise,require_jewel_osds pgmap v4466: 120 pgs, 8 pools, 105 MB data, 173 objects 13743 MB used, 22012 MB / 35756 MB avail 120 active+clean# ceph healthHEALTH_OK
Mon和Osd的启动方式
mon-1为各个monitor所在节点的主机名。# systemctl start ceph-mon@mon-1.service # systemctl restart ceph-mon@mon-1.service# systemctl stop ceph-mon@mon-1.service0为该节点的OSD的id,可以通过`ceph osd tree`查看# systemctl start/stop/restart ceph-osd@0.service
处理Osd Down的情况
查看osd 信息# ceph osd treeID WEIGHT TYPE NAME UP/DOWN REWEIGHT PRIMARY-AFFINITY -1 0.03400 root default -2 0.01700 host ceph-osd1 4 0.01700 osd.4 up 1.00000 1.00000 -3 0.01700 host ceph-osd2 3 0.01700 osd.3 up 1.00000 1.00000 1 0 osd.1 down 0 1.00000 2 0 osd.2 down 0 1.00000 将down的转台设置为out# ceph osd out osd.1osd.1 is already out. # ceph osd out osd.2osd.2 is already out.将osd从集群中删除 # ceph osd rm osd.2removed osd.2# ceph osd rm osd.1removed osd.1# ceph osd treeID WEIGHT TYPE NAME UP/DOWN REWEIGHT PRIMARY-AFFINITY -1 0.03400 root default -2 0.01700 host ceph-osd1 4 0.01700 osd.4 up 1.00000 1.00000 -3 0.01700 host ceph-osd2 3 0.01700 osd.3 up 1.00000 1.00000 从CRUSH 中删除关于CRUSH介绍 (http://www.cnblogs.com/chenxianpao/p/5568207.html)# ceph osd crush rm osd.3删除osd.3的认证信息# ceph auth del osd.3
部署Rgw网关
如果使用ceph 的对象存储,需要部署rgw网关。执行以下步骤创建一个新的rgw实例 (下面还是以ceph-admin为例)
# ceph-deploy rgw create ceph-admin
验证Ceph
写入数据并查看数据
创建一个普通文件,并向其写入数据 创建一个pool。格式为 rados mkpool pool-name
# rados mkpool data
将文件写入pool。格式:rados put object-name filename --pool=pool-name
# rados put test-object-0 /tmp/aaa --pool=data
查看文件是否在pool中。格式为rados -p pool-name ls
# rados -p data ls
确定文件位置。 格式为ceph osd map pool-name object-name
# ceph osd map data test-object-2osdmap e27 pool 'data' (7) object 'test-object-2' -> pg 7.cbbef8c8 (7.0) -> up ([1,0], p1) acting ([1,0], p1)
从pool 中读取文件。格式为rados get object-name --pool=pool-name filename (filename是你要保存文件)
# rados get test-object-0 --pool=data /tmp/myfile
从pool中删除文件。 格式为 rados rm object-name --pool=pool-name
# rados rm test-object-0 --pool=data
安装Calamari
安装Salt
在ceph-admin ceph-osd1 ceph-osd2 节点上安装
# yum localinstall salt-2015.8.1-1.el7.noarch.rpm# rpm -ivh salt-minion-2015.8.1-1.el7.noarch.rpm
在ceph-admin 安装salt-master
# rpm -ivh salt-master-2015.8.1-1.el7.noarch.rpm
安装Calamari-Server
# yum localinstall calamari-server-1.3.3-jewel.el7.centos.x86_64.rpm# yum install mod_wsgi -y
初始化 calamari
# calamari-ctl initialize
需要填写账户、Email、密码
修改calamari密码方式
格式 :# calamari-ctl change_password --password {password} {user-name}# calamari-ctl change_password --password 1234567 root
安装Diamond
# rpm -ivh diamond-3.4.68-jewel.noarch.rpm# mv /etc/diamond/diamond.conf.example /etc/diamond/diamond.conf
可以修改数据的刷新频率。下面两个文件控制刷新频率 修改文件 /etc/graphite/storage-schemas.conf(默认60s)
[calamari]pattern = .*retentions = 60s:1d,15m:7d可以将 retentions = 60s:1d,15m:7d 修改为 retentions = 3--------------------0s:1d,15m:7d
修改文件 /etc/diamond/diamond.conf
默认是注释#interval = 300修改为interval = 120
如果在初始化前,可以修改模板,注意初始化会用模板文件覆盖 /opt/calamari/salt/salt/base/diamond.conf
修改diamond配置文件 /etc/diamond/diamond.conf
# Graphite server hosthost = adm
这个host要填写你的calamari的管理平台服务器的主机名,这个地方是用diamond收集集群数据和硬件的数据发送到管理平台的机器的carbon进程,然后存储在whisper这个数据库当中的,所有的需要收集数据的机器都需要修改。 修改完成后 ,重启diamond
# /etc/init.d/diamond restart
修改salt-minion配置文件 /etc/salt/minion
master:adm
下面命令在每一个节点都执行以下。最后一个是节点主机名
# ceph-deploy calamari connect ceph-admin ceph-osd1 ceph-osd2# cat /etc/salt/minion.d/calamari.conf master: ceph-admin
重启服务
# systemctl restart salt-minion.service
Salt-Master 认证认可
在salt-master上执行认证(也就是安装calamari-server的服务器上)查询当前的认证请求
# salt-key -L
批准认证请求
# salt-key -A
查询是否正常通过,随便测试一下
# salt-key -L# salt '*' test.ping# salt '*' ceph.get_heartbeats
配置calamari-server 文件权限
# cd /var/log/calamari# chmod 777 -R *# service supervisord restart
安装 客户端 Romana
romana是集群的web管理界面,在calamari-server上安装
# rpm -ivh romana-1.2.2-36_gc62bb5b.el7.centos.x86_64.rpm
访问web管理平台,输入当前机器的IP地址接口,默认端口是80
测试结果
从部署流程到测试文件写入,监控界面来看以及使用感受来看,这个可以弃用 ,太TM烂了