仍然会监管ceph集群健康状态-创新互联

仍然会监管ceph集群健康状态 ,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。

创新互联建站专注于企业全网整合营销推广、网站重做改版、崖州网站定制设计、自适应品牌网站建设、H5开发商城建设、集团公司官网建设、成都外贸网站制作、高端网站制作、响应式网页设计等建站业务,价格优惠性价比高,为崖州等各大城市提供网站开发制作服务。

1、简介

1.1 介绍

    我们 需要 监测 的集群 正在 运行的各种服务进程;集群 所有 pgs 正常 状态 为 active + clean,其余 均为 异常 状态

1.2 集群 基础 监测

    集群 基础 监测 主要包括 检查 集群 健康状态,容量 使用 情况,monitor、osd 守护 进程的运行状态(up、down)

2、集群 健康 检测

    哈哈,平时 比较懒,每次都要 输入 那么多 ceph,有点烦,原来 ceph 有个 交互模式(没有 命令 记忆功能,哈哈哈,失算)

2.1 交互 模式下 检测 集群 健康

# ceph

## 查看 集群当前 状态,HEALTH_OK、HEALTH_WARN、HEALTH_ERR
ceph> health

## 效果 与 ceph -s 一样
ceph> status

## 集群 mon 相关 信息
ceph> quorum_status
ceph> mon_status

2.2 命令行 输入

    哈哈,还是 使用 命令行 操作吧,能通过 上下 按键 查找,同样的命令 连续执行时, 不需要 不停的输入

## 这两个 命令 执行 的效果一样
# ceph status
# ceph -s

## health : HEALTH_OK、HEALTH_WARN、HEALTH_ERR
# ceph health [detail]

备注:
    集群 健康 状态 "HEALTH_OK" 表示 集群 健康正常,若出现 "HEALTH_WARN XXX num placement group stale"时,等待 几分钟,一般 都可 自动 恢复 正常

2.3 集群 动态 监测

    某些 情况下,需要 动态 持续 的 关注 集群 事件信息

# ceph -w

3、集群 容量 检测

3.1 集群 容量 查看

    集群 处于健康状态运行,凡事都有个度,存储集群也是一样的,不可能一直写入,到了后期需要关注容量状态,毕竟数据量越大,会导致整个集群 的性能有所降低(毕竟不好好检测容量状态,数据阻塞导致的问题可不是那么 好解决的啦);该删的数据就删掉,实在没容量啦,就扩容吧,理论上是无限扩展;还有就是数据均衡的问题

## ceph中,所有的数据都写入数据池中(抽象出来的概念)
# ceph df

3.2 集群 容量 参数

    一般 情况下,osd 使用超过85%,就不会往该osd 写入数据;集群整体容量超过 95%集群就不能写入了;可以调整配置,控制集群的容量,一般不建议调太大;osd 超过 默认告警值 就想想数据能不能均衡;集群超过告警值, 扩容吧。

##  配置文件中添加容量配置参数,记得重启相关服务让配置生效
## 哈哈,其实也可以在线修改配置参数,后面单独编写文件介绍喽
# vim /etc/ceph/ceph.conf
...
## 集群 整体 容量 使用 上限
mon_osd_full_ratio = "0.950000" 

## 单个 osd 容量 使用 上限
mon_osd_nearfull_ratio = "0.850000" 
...

4、mon 检测

    一般 情况下,线上环境都会部署多个mon; 所以对集群进行数据读写时,需要检查mon状态

## dump比stat更详细,quorum_status比dump更详细
# ceph mon stat
# ceph mon dump
# ceph quorum_status -f json-pretty

5、osd 检测

5.1 osd 状态

    in:osd 加入集群
    out:osd 没有 加入集群
    down:osd 加入集群,但是服务停止
    up:osd 加入集群,并且服务正在运行

5.2 osd 状态 检测

## 检查所有osd状态
# ceph osd stat
# ceph osd dump
# ceph osd tree

看完上述内容是否对您有帮助呢?如果还想对相关知识有进一步的了解或阅读更多相关文章,请关注创新互联行业资讯频道,感谢您对创新互联的支持。

另外有需要云服务器可以了解下创新互联cdcxhl.cn,海内外云服务器15元起步,三天无理由+7*72小时售后在线,公司持有idc许可证,提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案,具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势,专为企业上云打造定制,能够满足用户丰富、多元化的应用场景需求。


网站标题:仍然会监管ceph集群健康状态-创新互联
本文来源:http://scyanting.com/article/ccdpid.html