openGauss數據庫邏輯備份與恢復

語言: CN / TW / HK

簡介

之前的數據庫遷移系列中,是將其他類型的數據庫數據遷移到openGauss中。實際使用中,還存在不同的openGauss數據庫之間的遷移或者數據的備份。數據在同類型數據庫遷移或者數據備份時,需要進行數據導出導入。openGauss提供了gs_dump工具導出指定數據,gs_restore工具將其恢復到數據庫中。工具在安裝包中已經攜帶,不需要額外安裝。

文章目錄

  • 簡介
  • 工具説明
    • gs_dump
    • gs_dumpall
    • gs_restore
  • 使用示例
    • 準備環境和數據
    • gs_dump導出
    • gs_dumpall導出
    • gs_restore導入

 

工具説明

在這裏插入圖片描述

gs_dump

gs_dump是openGauss用於導出數據庫相關信息的工具,用户可以自定義導出一個數據庫或其中的對象(模式、表、視圖等),回收站對象除外。支持導出的數據庫可以是默認數據庫postgres,也可以是自定義數據庫。gs_dump工具在進行數據導出時,其他用户可以訪問openGauss數據庫(讀或寫),支持導出完整一致的數據。pg_dump只備份數據庫集羣中的某個數據庫的數據,它不會導出角色和表空間相關的信息,因為這些信息是整個數據庫集羣共用的,不屬於某個單獨的數據庫。
gs_dump支持將數據庫信息導出至純文本格式的SQL腳本文件或其他歸檔文件中。還可以用於openGauss與PostgreSQL之間的遷移。
在這裏插入圖片描述

gs_dumpall

gs_dumpall是openGauss用於導出所有數據庫相關信息工具,導出特點和gs_dump非常相似,導出openGauss數據庫的所有數據,包括默認數據庫postgres的數據、自定義數據庫的數據以及openGauss所有數據庫公共的全局對象。gs_dumpall在導出openGauss所有數據庫時分為兩部分:

  • gs_dumpall自身對所有數據庫公共的全局對象進行導出,包括有關數據庫用户和組、表空間以及屬性(例如,適用於數據庫整體的訪問權限)信息。
  • gs_dumpall通過調用gs_dump來完成openGauss中各數據庫的SQL腳本文件導出,該腳本文件包含將數據庫恢復為其保存時的狀態所需要的全部SQL語句。
    以上兩部分導出的結果為純文本格式的SQL腳本文件,使用gsql運行該腳本文件可以恢復openGauss數據庫。

gs_restore

gs_restore是openGauss提供的針對gs_dump導出數據的導入工具。通過此工具可將由gs_dump生成的導出文件進行導入。主要功能包含:

導入到數據庫:如果連接參數中指定了數據庫,則數據將被導入到指定的數據庫中。其中,並行導入必須指定連接的密碼。導入時生成列會自動更新,並像普通列一樣保存。

導入到腳本文件:如果未指定導入數據庫,則創建包含重建數據庫所必須的SQL語句腳本並寫入到文件或者標準輸出。等效於直接使用gs_dump導出為純文本格式。

使用示例

注意:gs_dump和gs_restore工具需要由操作系統用户omm執行。

準備環境和數據

環境:CentOS 7.6 + openGauss 3.1.0 極簡版

建用户和數據庫

[omm@pekphisprb70593 ~]$ gsql -d postgres  
CREATE USER dumpuser identified by 'Gauss_234'; 
GRANT ALL PRIVILEGES TO dumpuser ; 
CREATE DATABASE dumpdb with owner dumpuser ENCODING 'utf8' template = template0;

建表

create table test1 (id integer,name varchar(20),salary float,time date,addr varchar(200),primary key(id)) ;
insert into test1 values (1,'zhangsan',2000.00,'2018-06-01 00:00:00','beijing');
insert into test1 values (2,'李四',2000.89,'2018-06-01 00:00:00','西安');
insert into test1 values (3,'Bob',2000,'2018-06-02 00:00:00','南京');

create table if not exists test2(id int primary key);

create table public.test3(id int primary key,name varchar(20));
insert into public.test3 values (1234567,'Kevin');


[omm@hecs-1105531 ~]$ cd /home/omm/
[omm@hecs-1105531 ~]$ mkdir dump

gs_dump導出

通用參數説明:

-f, –file=FILENAME

將輸出發送至指定文件或目錄。如果省略該參數,則使用標準輸出。如果輸出格式為(-F c/-F d/-F t)時,必須指定-f參數。如果-f的參數值含有目錄,要求當前用户對該目錄具有讀寫權限,並且不能指定已有目錄。

-F, –format=c|d|t|p

選擇輸出格式。格式如下:

p|plain:輸出一個文本SQL腳本文件(默認)。

c|custom:輸出一個自定義格式的歸檔,並且以目錄形式輸出,作為gs_restore輸入信息。該格式是最靈活的輸出格式,因為能手動選擇,而且能在恢復過程中將歸檔項重新排序。該格式默認狀態下會被壓縮。

d|directory:該格式會創建一個目錄,該目錄包含兩類文件,一類是目錄文件,另一類是每個表和blob對象對應的數據文件。

t|tar:輸出一個tar格式的歸檔形式,作為gs_restore輸入信息。tar格式與目錄格式兼容;tar格式歸檔形式在提取過程中會生成一個有效的目錄格式歸檔形式。但是,tar格式不支持壓縮且對於單獨表有8GB的大小限制。此外,表數據項的相應排序在恢復過程中不能更改。

輸出一個tar格式的歸檔形式,也可以作為gsql輸入信息。
-c, –clean

在將創建數據庫對象的指令輸出到備份文件之前,先將清理(刪除)數據庫對象的指令輸出到備份文件中。(如果目標數據庫中沒有任何對象,gs_restore工具可能會輸出一些提示性的錯誤信息)

該選項只對文本格式有意義。針對歸檔格式,可以調用gs_restore時指定選項。

-C, –create

備份文件以創建數據庫和連接到創建的數據庫的命令開始。(如果命令腳本是這種方式執行,可以先指定任意數據庫用於執行創建數據庫的命令,數據不會恢復到指定的數據庫中,而是恢復到創建的數據庫中。)

該選項只對文本格式有意義。針對歸檔格式,可以在調用gs_restore時指定選項。

-E, –encoding=ENCODING

以指定的字符集編碼創建轉儲。默認情況下,以數據庫編碼創建轉儲。(得到相同結果的另一個辦法是將環境變量“PGCLIENTENCODING”設置為所需的轉儲編碼。)

-n, –schema=SCHEMA

只轉儲與模式名稱匹配的模式,此選項包括模式本身和所有它包含的對象。如果該選項沒有指定,所有在目標數據庫中的非系統模式將會被轉儲。寫入多個-n選項來選擇多個模式。此外,根據gsql的\d命令所使用的相同規則,模式參數可被理解成一個pattern,所以多個模式也可以通過在該pattern中寫入通配符來選擇。使用通配符時,注意給pattern打引號,防止shell擴展通配符。

更多參數説明參考官網文檔。

導出為文本格式:
執行gs_dump,導出dumpdb 數據庫全量信息,導出的DUMPDB_backup.sql文件格式為純文本格式。這種的可以編輯,但是不建議。

[omm@hecs-1105531 ~]$ gs_dump -U dumpuser -W Gauss_234 -f /home/omm/dump/DUMPDB_backup.sql -p 5432 dumpdb -F p
gs_dump[port='5432'][dumpdb][2022-12-07 15:25:09]: The total objects number is 439.
gs_dump[port='5432'][dumpdb][2022-12-07 15:25:09]: [100.00%] 439 objects have been dumped.
gs_dump[port='5432'][dumpdb][2022-12-07 15:25:09]: dump database dumpdb successfully
gs_dump[port='5432'][dumpdb][2022-12-07 15:25:09]: total time: 1493  ms

導出為歸檔格式
執行gs_dump,導出dumpdb數據庫全量信息,導出的DUMPDB_backup.tar文件格式為tar格式。

[omm@hecs-1105531 dump]$ gs_dump -U dumpuser -W Gauss_234 -f /home/omm/dump/DUMPDB_backup.tar -p 5432 dumpdb -F t
gs_dump[port='5432'][dumpdb][2022-12-07 15:54:45]: The total objects number is 439.
gs_dump[port='5432'][dumpdb][2022-12-07 15:54:45]: [100.00%] 439 objects have been dumped.
gs_dump[port='5432'][dumpdb][2022-12-07 15:54:45]: dump database dumpdb successfully
gs_dump[port='5432'][dumpdb][2022-12-07 15:54:45]: total time: 1452  ms

執行gs_dump,導出dumpdb數據庫全量信息,導出的DUMPDB_backup.dmp文件格式為自定義歸檔格式。

[omm@hecs-1105531 dump]$ gs_dump -U dumpuser -W Gauss_234 -f /home/omm/dump/DUMPDB_backup.dmp -p 5432 dumpdb -F c
gs_dump[port='5432'][dumpdb][2022-12-08 09:37:18]: The total objects number is 439.
gs_dump[port='5432'][dumpdb][2022-12-08 09:37:18]: [100.00%] 439 objects have been dumped.
gs_dump[port='5432'][dumpdb][2022-12-08 09:37:18]: dump database dumpdb successfully
gs_dump[port='5432'][dumpdb][2022-12-08 09:37:18]: total time: 1463  ms

導出指定schema下面的表
執行gs_dump,導出dumpdb數據庫的表(或視圖、或序列、或外表)對象,例如表test1。

[omm@hecs-1105531 dump]$ gs_dump -U dumpuser -W Gauss_234 -f /home/omm/dump/test1_bkp.sql -t public.test1 -p 5432 dumpdb
gs_dump[port='5432'][dumpdb][2022-12-07 16:01:28]: The total objects number is 423.
gs_dump[port='5432'][dumpdb][2022-12-07 16:01:28]: [100.00%] 423 objects have been dumped.
gs_dump[port='5432'][dumpdb][2022-12-07 16:01:28]: dump database dumpdb successfully
gs_dump[port='5432'][dumpdb][2022-12-07 16:01:28]: total time: 1024  ms

gs_dumpall導出

使用gs_dumpall一次導出openGauss的所有數據庫

[omm@hecs-1105531 dump]$ gs_dumpall -f  /home/omm/dump/bkpall.sql -p 5432
gs_dump[port='5432'][dbname='dumpdb'][2022-12-07 16:12:17]: The total objects number is 439.
gs_dump[port='5432'][dbname='dumpdb'][2022-12-07 16:12:17]: [100.00%] 439 objects have been dumped.
gs_dump[port='5432'][dbname='dumpdb'][2022-12-07 16:12:17]: dump database dbname='dumpdb' successfully
gs_dump[port='5432'][dbname='dumpdb'][2022-12-07 16:12:17]: total time: 1243  ms
gs_dump[port='5432'][dbname='finance'][2022-12-07 16:12:18]: The total objects number is 459.
gs_dump[port='5432'][dbname='finance'][2022-12-07 16:12:19]: [100.00%] 459 objects have been dumped.
gs_dump[port='5432'][dbname='finance'][2022-12-07 16:12:19]: dump database dbname='finance' successfully
gs_dump[port='5432'][dbname='finance'][2022-12-07 16:12:19]: total time: 1798  ms
gs_dump[port='5432'][dbname='mydb'][2022-12-07 16:12:20]: The total objects number is 621.
gs_dump[port='5432'][dbname='mydb'][2022-12-07 16:12:20]: [100.00%] 621 objects have been dumped.
gs_dump[port='5432'][dbname='mydb'][2022-12-07 16:12:20]: dump database dbname='mydb' successfully
gs_dump[port='5432'][dbname='mydb'][2022-12-07 16:12:20]: total time: 1905  ms
gs_dump[port='5432'][dbname='newdb'][2022-12-07 16:12:22]: The total objects number is 432.
gs_dump[port='5432'][dbname='newdb'][2022-12-07 16:12:22]: [100.00%] 432 objects have been dumped.
gs_dump[port='5432'][dbname='newdb'][2022-12-07 16:12:23]: dump database dbname='newdb' successfully
gs_dump[port='5432'][dbname='newdb'][2022-12-07 16:12:23]: total time: 2070  ms
gs_dump[port='5432'][dbname='opengauss_db'][2022-12-07 16:12:25]: The total objects number is 611.
gs_dump[port='5432'][dbname='opengauss_db'][2022-12-07 16:12:25]: [100.00%] 611 objects have been dumped.
gs_dump[port='5432'][dbname='opengauss_db'][2022-12-07 16:12:25]: dump database dbname='opengauss_db' successfully
gs_dump[port='5432'][dbname='opengauss_db'][2022-12-07 16:12:25]: total time: 2529  ms
gs_dump[port='5432'][dbname='postgres'][2022-12-07 16:12:27]: The total objects number is 430.
gs_dump[port='5432'][dbname='postgres'][2022-12-07 16:12:27]: [100.00%] 430 objects have been dumped.
gs_dump[port='5432'][dbname='postgres'][2022-12-07 16:12:27]: dump database dbname='postgres' successfully
gs_dump[port='5432'][dbname='postgres'][2022-12-07 16:12:27]: total time: 1576  ms
gs_dump[port='5432'][dbname='school'][2022-12-07 16:12:29]: The total objects number is 449.
gs_dump[port='5432'][dbname='school'][2022-12-07 16:12:29]: [100.00%] 449 objects have been dumped.
gs_dump[port='5432'][dbname='school'][2022-12-07 16:12:29]: dump database dbname='school' successfully
gs_dump[port='5432'][dbname='school'][2022-12-07 16:12:29]: total time: 1933  ms
gs_dumpall[port='5432'][2022-12-07 16:12:29]: dumpall operation successful
gs_dumpall[port='5432'][2022-12-07 16:12:29]: total time: 13342  ms
[omm@hecs-1105531 dump]$ ll bkpall.sql
-rw------- 1 omm dbgrp 183028 Dec  7 16:12 bkpall.sql

gs_restore導入

工具通用參數:

-d, –dbname=NAME

連接數據庫dbname並直接導入到該數據庫中。
-a, –data-only

只導入數據,不導入模式(數據定義)。gs_restore的導入是以追加方式進行的。

-c, –clean

在重新創建數據庫對象前,清理(刪除)已存在於將要還原的數據庫中的數據庫對象。

-C, –create

導入到數據庫之前會先使用CREATE DATABASE創建數據庫(指定該選項後,-d指定的數據庫僅用以執行CREATE DATABASE命令,所有數據將被導入到創建的數據庫中)。

-e, –exit-on-error

當發送SQL語句到數據庫時如果出現錯誤,請退出。默認狀態下會繼續,且在導入後會顯示一系列錯誤信息。
更多參數説明參考官網文檔。

下面我們將之前導出的備份文件進行導入。
在此之前,對於導出的單個數據庫,需要新建一個空的數據庫進行恢復。

[omm@hecs-1105531 dump]$ gsql -d postgres
openGauss=# create database new_dmpdb1;
openGauss=# create database new_dmpdb2;
openGauss=# create database new_dmpdb3;
openGauss=# \q

執行gs_restore,將導出的DUMPDB_backup.tar文件(tar格式)導入到new_dmpdb2數據庫。
成功時顯示如下:

[omm@hecs-1105531 dump]$ gs_restore /home/omm/dump/DUMPDB_backup.tar -p 5432 -d new_dmpdb2;
start restore operation ...
table test1 complete data imported !
table test2 complete data imported !
table test3 complete data imported !
Finish reading 15 SQL statements!
end restore operation ...
restore operation successful
total time: 37  ms

在這裏插入圖片描述

恢復指定表數據
執行gs_restore,使用自定義歸檔格式的DUMPDB_backup.dmp文件來導入PUBLIC模式下表test1。
成功時顯示如下:

[omm@hecs-1105531 dump]$ gs_restore /home/omm/dump/DUMPDB_backup.dmp -p 5432 -d new_dmpdb1 -n public -t test1
start restore operation ...
table test1 complete data imported !
Finish reading 15 SQL statements!
end restore operation ...
restore operation successful
total time: 12  ms

在這裏插入圖片描述

注意,gs_restore默認是以追加的方式進行數據導入。為避免多次導入造成數據異常,在進行導入時,建議使用“-c” 參數,在重新創建數據庫對象前,清理(刪除)已存在於將要還原的數據庫中的數據庫對象。

使用gsql 導入純文本格式
gsql是openGauss提供在命令行下運行的數據庫連接工具,可以通過此工具連接服務器並對其進行操作和維護,除了具備操作數據庫的基本功能,gsql還提供了若干高級特性,便於用户使用。這裏我們使用他的“執行SQL語句”能力完成導入。
執行gsql ,使用純文本格式DUMPDB_backup.sql文件來導入dumpdb 下全部信息。執行信息如下:

[omm@hecs-1105531 dump]$ gsql -d new_dmpdb3 -U dumpuser -f /home/omm/dump/DUMPDB_backup.sql
Password for user dumpuser:根據提示輸入密碼

查看結果
在這裏插入圖片描述

實驗結束。

需要注意的是,邏輯備份只能基於備份時刻進行數據轉儲,所以恢復時也只能恢復到備份時保存的數據。例如,T1時刻啟動gs_dump導出A數據庫,那麼導出數據結果將會是T1時刻A數據庫的數據狀態,T1時刻之後對A數據庫的修改不會被導出。所以建議在業務空閒期間操作。對於故障點和備份點之間的數據,邏輯備份無能為力,邏輯備份適合備份那些很少變化的數據。如果通過邏輯備份進行全庫恢復,通常需要重建數據庫,導入備份數據來完成,恢復時間較長,通常不被採用,而使用物理備份恢復。由於邏輯備份具有平台無關性,所以更為常見的是邏輯備份被作為一個數據遷移及移動的主要手段。

🍒如果您覺得博主的文章還不錯或者有幫助的話,請關注一下博主,如果三連點贊評論收藏就更好啦!謝謝各位大佬給予的支持!