宅男在线永久免费观看网直播,亚洲欧洲日产国码无码久久99,野花社区在线观看视频,亚洲人交乣女bbw,一本一本久久a久久精品综合不卡

全部
常見問題
產(chǎn)品動(dòng)態(tài)
精選推薦

分布式數(shù)據(jù)庫(kù)的通用診斷方法

管理 管理 編輯 刪除

用過分布式數(shù)據(jù)庫(kù)的朋友都知道,分布式數(shù)據(jù)庫(kù)從組成結(jié)構(gòu)上來說更加復(fù)雜。甚至有些國(guó)產(chǎn)分布式數(shù)據(jù)庫(kù)是由幾十個(gè)不同的開源組件組合而成的。僅僅安裝部署,我們就需要學(xué)習(xí)ETCD、ZOOKEEPER、KAFKA、Mysql、Myproxy、普羅米修斯等大型開源組件后才能完成。不過也有些朋友說分布式數(shù)據(jù)庫(kù)運(yùn)維其實(shí)沒那么復(fù)雜,大部分的運(yùn)行中遇到的軟硬件故障,分布式數(shù)據(jù)庫(kù)都會(huì)自動(dòng)處置,不需要運(yùn)維人員干預(yù)。分布式數(shù)據(jù)庫(kù)出小問題的時(shí)候比較容易處理,數(shù)據(jù)庫(kù)本身的高可用就能自動(dòng)規(guī)避一些小問題,不過分布式數(shù)據(jù)庫(kù)最怕出大問題,最怕出了問題不知道如何處置。那么我們?cè)撊绾蝸矸治龇植际綌?shù)據(jù)庫(kù)的問題呢?

首先是分布式數(shù)據(jù)庫(kù)本身的高可用架構(gòu)會(huì)屏蔽一定的故障。因此對(duì)于分布式數(shù)據(jù)庫(kù)來說,某個(gè)組件的故障是最容易處置的。隔離故障硬件,修復(fù)后再加入集群就可以了。最怕的是硬件不穩(wěn)定,時(shí)好時(shí)壞。比如某個(gè)網(wǎng)絡(luò)接口一會(huì)兒UP,一會(huì)兒宕,并且是不是丟包。這種情況很可能引發(fā)分布式數(shù)據(jù)庫(kù)的嚴(yán)重故障。不過如果能夠盡早發(fā)現(xiàn)這個(gè)問題,并且盡快手工停掉這個(gè)網(wǎng)絡(luò)端口,對(duì)數(shù)據(jù)庫(kù)的影響就很小了。硬盤故障也是如此,特別是多路徑故障,很容易形成時(shí)好時(shí)壞的局面,這時(shí)候IO讀寫變得十分不穩(wěn)定,這個(gè)節(jié)點(diǎn)就會(huì)變得不穩(wěn)定,從而可能引發(fā)整個(gè)數(shù)據(jù)庫(kù)的問題。

對(duì)于硬件故障來說,網(wǎng)絡(luò)故障對(duì)分布式數(shù)據(jù)庫(kù)的影響是全方位的,偶發(fā)的網(wǎng)絡(luò)延時(shí)增大,網(wǎng)絡(luò)丟包等,可能會(huì)導(dǎo)致分布式數(shù)據(jù)庫(kù)性能抖動(dòng)甚至引發(fā)主從副本誤切換,從而引發(fā)更大的故障。確保分布式數(shù)據(jù)庫(kù)的網(wǎng)絡(luò)帶寬與網(wǎng)絡(luò)延時(shí)在一個(gè)合理的范圍內(nèi)并且網(wǎng)絡(luò)帶寬不出現(xiàn)瓶頸十分關(guān)鍵。

集群數(shù)據(jù)分布不均衡和負(fù)載分布不均衡也可能會(huì)導(dǎo)致分布式數(shù)據(jù)庫(kù)的嚴(yán)重故障,當(dāng)某個(gè)節(jié)點(diǎn)出現(xiàn)資源瓶頸時(shí),這個(gè)影響可能會(huì)引發(fā)大型故障。因此對(duì)節(jié)點(diǎn)資源的監(jiān)控,一旦發(fā)現(xiàn)較長(zhǎng)時(shí)間出現(xiàn)某些節(jié)點(diǎn)資源瓶頸,則需要盡快排查,避免引發(fā)大故障。

分布式數(shù)據(jù)庫(kù)的慢SQL分析也是十分關(guān)鍵的,發(fā)現(xiàn)慢SQL,讀懂分布式執(zhí)行計(jì)劃,發(fā)現(xiàn)執(zhí)行計(jì)劃中存在的問題,是分布式數(shù)據(jù)庫(kù)運(yùn)維DBA日常經(jīng)常要干的事情。如果發(fā)現(xiàn)某個(gè)節(jié)點(diǎn)上的并行執(zhí)行比較慢,那么就需要對(duì)某個(gè)節(jié)點(diǎn)進(jìn)行分析,排除隱患了。

根據(jù)上面的內(nèi)容,我們對(duì)局部思維導(dǎo)圖做了改寫。實(shí)際上作為通用的分布式數(shù)據(jù)庫(kù)分析方法。首先還是需要分析操作系統(tǒng)日志和數(shù)據(jù)庫(kù)日志。只是目前來說國(guó)產(chǎn)分布式數(shù)據(jù)庫(kù)的日志分析十分困難,缺乏好的工具可以從數(shù)據(jù)庫(kù)中自動(dòng)抽取日志相關(guān)信息,并且能夠自動(dòng)對(duì)多節(jié)點(diǎn)日志中的各種事件進(jìn)行排序。OceanBase的開源診斷工具obdiag是目前我見到過的比較好的國(guó)產(chǎn)分布式數(shù)據(jù)庫(kù)診斷工具,在日志分析方面的功能還是挺有用的。不過離我理想中的分析能力還有一定的差距。

在所有分析開始之前,首先要排除硬件故障的可能性。對(duì)大型分布式數(shù)據(jù)庫(kù)而言,硬件監(jiān)控是必須要有的。如果靠人工排查,那么將會(huì)相當(dāng)耗時(shí)。通過OS日志分析等也可以快速定位硬件故障,只不過如果是手工操作,則工作量過大。

日志分析后就進(jìn)入了今天我畫的這張圖的內(nèi)容了。第一步首先要檢查的是時(shí)鐘同步和時(shí)鐘源(clocksource)是否一致,時(shí)鐘問題對(duì)于集中式數(shù)據(jù)庫(kù)來說關(guān)系不是很大,但是對(duì)于大多數(shù)分布式數(shù)據(jù)庫(kù)來說十分關(guān)鍵。

第二步是檢查網(wǎng)絡(luò)是否存在問題,包括網(wǎng)卡故障、PING延時(shí)、網(wǎng)絡(luò)吞吐量、網(wǎng)絡(luò)丟包、網(wǎng)絡(luò)流量的均衡性等都需要關(guān)注。

第三步是進(jìn)行各種操作系統(tǒng)資源的分析。對(duì)于分布式數(shù)據(jù)庫(kù)而言首先我們不需要直接下鉆到某臺(tái)服務(wù)器去進(jìn)行觀察,而是要觀察多個(gè)對(duì)等服務(wù)器節(jié)點(diǎn)的資源均衡性。分布式數(shù)據(jù)庫(kù)極容易出問題的地方是資源不均衡,如果一個(gè)幾十臺(tái)服務(wù)器節(jié)點(diǎn)的分布式數(shù)據(jù)庫(kù)環(huán)境中只有某一個(gè)或者某幾個(gè)服務(wù)器的內(nèi)存換頁(yè)嚴(yán)重或者IO延時(shí)過高,那么可能會(huì)讓整個(gè)集群的性能都受到極大的影響。如果發(fā)現(xiàn)不均衡,那么首先要考慮是不是應(yīng)用負(fù)載不均衡,或者分布式執(zhí)行計(jì)劃出現(xiàn)了問題,這些都是十分常見的。

對(duì)于分布式數(shù)據(jù)庫(kù)而言,會(huì)話分析也與集中式數(shù)據(jù)庫(kù)不同,會(huì)話均衡性、活躍會(huì)話均衡性、新增會(huì)話均衡性等指標(biāo)是發(fā)現(xiàn)問題的關(guān)鍵,因此針對(duì)這些指標(biāo),需要常態(tài)化采集。

請(qǐng)登錄后查看

各大電商API接口——> Brad19970108118 最后編輯于2024-12-09 14:30:34

快捷回復(fù)
回復(fù)
回復(fù)
回復(fù)({{post_count}}) {{!is_user ? '我的回復(fù)' :'全部回復(fù)'}}
排序 默認(rèn)正序 回復(fù)倒序 點(diǎn)贊倒序

{{item.user_info.nickname ? item.user_info.nickname : item.user_name}} LV.{{ item.user_info.bbs_level || item.bbs_level }}

作者 管理員 企業(yè)

{{item.floor}}# 同步到gitee 已同步到gitee {{item.is_suggest == 1? '取消推薦': '推薦'}}
{{item.is_suggest == 1? '取消推薦': '推薦'}}
沙發(fā) 板凳 地板 {{item.floor}}#
{{item.user_info.title || '暫無簡(jiǎn)介'}}
附件

{{itemf.name}}

{{item.created_at}}  {{item.ip_address}}
打賞
已打賞¥{{item.reward_price}}
{{item.like_count}}
{{item.showReply ? '取消回復(fù)' : '回復(fù)'}}
刪除
回復(fù)
回復(fù)

{{itemc.user_info.nickname}}

{{itemc.user_name}}

回復(fù) {{itemc.comment_user_info.nickname}}

附件

{{itemf.name}}

{{itemc.created_at}}
打賞
已打賞¥{{itemc.reward_price}}
{{itemc.like_count}}
{{itemc.showReply ? '取消回復(fù)' : '回復(fù)'}}
刪除
回復(fù)
回復(fù)
查看更多
打賞
已打賞¥{{reward_price}}
922
{{like_count}}
{{collect_count}}
添加回復(fù) ({{post_count}})

相關(guān)推薦

快速安全登錄

使用微信掃碼登錄
{{item.label}} 加精
{{item.label}} {{item.label}} 板塊推薦 常見問題 產(chǎn)品動(dòng)態(tài) 精選推薦 首頁(yè)頭條 首頁(yè)動(dòng)態(tài) 首頁(yè)推薦
取 消 確 定
回復(fù)
回復(fù)
問題:
問題自動(dòng)獲取的帖子內(nèi)容,不準(zhǔn)確時(shí)需要手動(dòng)修改. [獲取答案]
答案:
提交
bug 需求 取 消 確 定
打賞金額
當(dāng)前余額:¥{{rewardUserInfo.reward_price}}
{{item.price}}元
請(qǐng)輸入 0.1-{{reward_max_price}} 范圍內(nèi)的數(shù)值
打賞成功
¥{{price}}
完成 確認(rèn)打賞

微信登錄/注冊(cè)

切換手機(jī)號(hào)登錄

{{ bind_phone ? '綁定手機(jī)' : '手機(jī)登錄'}}

{{codeText}}
切換微信登錄/注冊(cè)
暫不綁定
CRMEB客服

CRMEB咨詢熱線 咨詢熱線

400-8888-794

微信掃碼咨詢

CRMEB開源商城下載 源碼下載 CRMEB幫助文檔 幫助文檔
返回頂部 返回頂部
CRMEB客服