SAS Data Integration Studio的目的是將不同數(shù)據(jù)源進(jìn)行協(xié)調(diào),統(tǒng)一數(shù)據(jù),SAS提供的以下數(shù)據(jù)整合途徑。
1. SAS Data Integration Studio的連接性和元數(shù)據(jù)功能。通過不同數(shù)據(jù)源,共享的元數(shù)據(jù)環(huán)境提供了一致的數(shù)據(jù)定義,SAS軟件容許我們進(jìn)行數(shù)據(jù)連接、獲取,并且可以以多種方式存儲(chǔ)數(shù)據(jù),在不同環(huán)境或應(yīng)用平臺(tái)上應(yīng)用數(shù)據(jù)流、程序等。例如,我們可以在企業(yè)資源計(jì)劃(Enterprise Resource Planning)系統(tǒng)、關(guān)系數(shù)據(jù)庫管理系統(tǒng)(RDBMS)、平面文件、傳統(tǒng)系統(tǒng)、信息列、可擴(kuò)展標(biāo)示語言(Extensive Makeup Language)中進(jìn)行信息管理。
2. SAS Data Integration Studio的數(shù)據(jù)清理和濃縮功能。SAS Data Integration Studio軟件可以為我們配置文件、清理、增強(qiáng),監(jiān)測(cè)數(shù)據(jù)來創(chuàng)建一致、可靠的數(shù)據(jù)信息,并提供數(shù)據(jù)轉(zhuǎn)換和改善數(shù)據(jù)的一系列的功能。
3. SAS Data Integration Studio的提取、轉(zhuǎn)換和加載功能。SAS Data Integration Studio可以為我們執(zhí)行跨企業(yè)間的數(shù)據(jù)提取、轉(zhuǎn)換和加載,創(chuàng)建一致、有效的信息。他提供了點(diǎn)擊界面,使設(shè)計(jì)者可以很方便的建立數(shù)據(jù)流、迅速識(shí)別輸入和輸出系統(tǒng)、在元數(shù)據(jù)里建立商業(yè)規(guī)則,這些都將有利于快速生成數(shù)據(jù)庫、數(shù)據(jù)流、數(shù)據(jù)集。
4. SAS Data Integration Studio的遷移和同步功能。SAS Data Integration Studio執(zhí)行的遷移和同步功能,可以在不同的數(shù)據(jù)源和系統(tǒng)里進(jìn)行。數(shù)據(jù)轉(zhuǎn)換可供更改、重新格式化與合并信息。當(dāng)數(shù)據(jù)被復(fù)制、移動(dòng)、或同步操作時(shí),實(shí)時(shí)數(shù)據(jù)質(zhì)量集成允許凈化數(shù)據(jù),并且我們能很容易的建立符合商業(yè)規(guī)則的、可重復(fù)使用的應(yīng)用庫。
5. SAS Data Integration Studio的數(shù)據(jù)聯(lián)合功能。SAS Data Integration Studio可以使我們無需移動(dòng)實(shí)際數(shù)據(jù)的情況下,進(jìn)行多系統(tǒng)的數(shù)據(jù)查詢、使用功能。他提供了一個(gè)虛擬環(huán)境用于訪問數(shù)據(jù)結(jié)構(gòu)、企業(yè)資源計(jì)劃(Enterprise Resource Planning)系統(tǒng)、關(guān)系數(shù)據(jù)庫管理系統(tǒng)(RDBMS)、平面文件、傳統(tǒng)系統(tǒng)、信息列、可擴(kuò)展標(biāo)示語言(Extensive Makeup Language)等,另外SAS Data Integration Studio可以在虛擬環(huán)境和實(shí)事訪問間實(shí)現(xiàn)數(shù)據(jù)連接,分析。在語義商業(yè)元數(shù)據(jù)層隱藏著這來自上一級(jí)的員工信息的復(fù)雜數(shù)據(jù)。
6. SAS Data Integration Studio的主數(shù)據(jù)功能。SAS Data Integration Studio可以從多個(gè)數(shù)據(jù)源里創(chuàng)建統(tǒng)一的數(shù)據(jù)視圖。輸入和輸出數(shù)據(jù)源的語義數(shù)據(jù)描述可以單獨(dú)識(shí)別每個(gè)實(shí)例的業(yè)務(wù)元素(如客戶、產(chǎn)品、賬戶等),規(guī)范的主數(shù)據(jù)模型提供事實(shí)的單一通道,以確保數(shù)據(jù)在轉(zhuǎn)換和嵌入時(shí)的正確性。
SAS Data Integration Studio的優(yōu)點(diǎn)
SAS Data Integration Studio在項(xiàng)目分析上有很多優(yōu)勢(shì),大量的自定義代碼和多功能間的完善空間很大。
1. 如果希望快速生產(chǎn)大型的數(shù)據(jù)倉庫、數(shù)據(jù)集和數(shù)據(jù)流,SAS Data Integration Studio可以大大的降低項(xiàng)目開發(fā)時(shí)間。
2. SAS Data Integration Studio可以通過提供不同組織間的協(xié)作、代碼的可重復(fù)利用和通用元數(shù)據(jù)庫等技術(shù),來控制成本。
3. 通過多平臺(tái)的可伸縮性和互操作性,增加現(xiàn)有IT投資回報(bào)率
4. SAS Data Integration Studio軟件可用于創(chuàng)建可重復(fù)使用,易于修改,便于儲(chǔ)存數(shù)據(jù)的過程流,該過程流可以實(shí)現(xiàn)文檔自動(dòng)化和數(shù)據(jù)的沿襲分析(data lineage analysis)等功能。
SAS Data Integration Studio環(huán)境
管理員組使用SAS Management Console連接SAS Metadata Server。當(dāng)通過網(wǎng)絡(luò)進(jìn)入元數(shù)據(jù)的服務(wù)器、數(shù)據(jù)庫或其他數(shù)據(jù)源時(shí),就可以存儲(chǔ)這些元數(shù)據(jù)。SAS Data Integration Studio連接相同元數(shù)據(jù)庫和不同的庫或表后,開始創(chuàng)建過程流來讀取數(shù)據(jù)源表和目標(biāo)表,并創(chuàng)建物理存儲(chǔ)。