CDA數(shù)據(jù)分析師:數(shù)據(jù)科學(xué)、人工智能從業(yè)者的在線大學(xué)。
數(shù)據(jù)科學(xué)(Python/R/Julia)數(shù)據(jù)分析、機器學(xué)習(xí)、深度學(xué)習(xí) Q群:874447702
MySQL8.0.17推出了一個重量級的功能:clone plugin。允許用戶可以將當前實例進行本地或者遠程的clone。這在某些場景尤其想快速搭建復(fù)制備份或者在group replication里加入新成員時非常有用。本文主要試玩下該功能,并試圖闡述下其實現(xiàn)的機制是什么。
我們以本地clone為例,因為去除網(wǎng)絡(luò)部分,理解起來會相對簡單點。 也不會過度接觸代碼部分,僅僅做簡單的原理性闡述
示例
本地clone
本地clone無需啟動額外mysqld, 只要在實例上執(zhí)行一條sql語句,指定下目標目錄即可:
需要BACKUP_ADMIN權(quán)限
遠程clone:
需要指定絕對路徑,并且路徑目錄必須不存在
在接受機器上啟動mysqld,執(zhí)行上述語句連接到目標機器,就能從目標機器上clone數(shù)據(jù)到本地,注意如果沒有指定data directory的話,就默認配置的目錄,已有的文件會被清理掉,并在clone完成后重啟
兩個實例上都需要安裝clone plugin
必須有相同的字符集設(shè)置
官方文檔列出的一些限制:
主要流程
主要流程包含如下幾個過程:
INIT階段
需要持有backup lock, 阻止ddl進行
FILE COPY
按照文件進行拷貝,同時開啟page tracking功能,記錄在拷貝過程中修改的page, 此時會設(shè)置buf_pool->track_page_lsn為當前l(fā)sn,track_page_lsn在flush page階段用到:
PAGE COPY
這里有兩個動作
開啟redo archiving功能,從當前點開始存儲新增的redo log,這樣從當前點開始所有的增量修改都不會丟失
同時上一步在page track的page被發(fā)送到目標端。確保當前點之前所做的變更一定發(fā)送到目標端
關(guān)于redo archiving,實際上這是官方早就存在的功能,主要用于官方的企業(yè)級備份工具,但這里clone利用了該特性來維持增量修改產(chǎn)生的redo。 在開始前會做一次checkpoint, 開啟一個后臺線程log_archiver_thread來做日志歸檔。當有新的寫入時(notify_about_advanced_write_lsn)也會通知他去archive
當arch_log_sys處于活躍狀態(tài)時,他會控制日志寫入以避免未歸檔的日志被覆蓋(log_writer_wait_on_archiver), 注意如果log_writer等待時間過長的話, archive任務(wù)會被中斷掉
Redo Copy
停止Redo Archiving", 所有歸檔的日志被發(fā)送到目標端,這些日志包含了從page copy階段開始到現(xiàn)在的所有日志,另外可能還需要記下當前的復(fù)制點,例如最后一個事務(wù)提交時的binlog位點或者gtid信息,在系統(tǒng)頁中可以找到
Done
目標端重啟實例,通過crash recovery將redo log應(yīng)用上去。