2個(gè)Server:
Informatica Repository Server:資料庫(kù)Server,管理ETL過(guò)程中產(chǎn)生的元數(shù)據(jù)
Informatica Server:ETL引擎
5個(gè)Client:
PowerCenter Designer:設(shè)計(jì)開(kāi)發(fā)環(huán)境,定義源及目標(biāo)數(shù)據(jù)結(jié)構(gòu);設(shè)計(jì)轉(zhuǎn)換規(guī)則,生成ETL映射
Workflow Manager:合理的實(shí)現(xiàn)復(fù)雜的ETL工作流,基于時(shí)間,事件的作業(yè)調(diào)度
Workflow Monitor:監(jiān)控Workflow和Session運(yùn)行情況,生成日志和報(bào)告
Repository Manager:資料庫(kù)管理,包括安全性管理等
Repository Server Administrator Console:資料庫(kù)的建立與維護(hù)
Informatica PowerCenter的功能列表:
異構(gòu)數(shù)據(jù)源,異構(gòu)目標(biāo)
多種緩慢變化維模版
Mapping/Session/Workflow/Server級(jí)參數(shù)化,支持參數(shù)文件
局部變量,前后記錄比較
條件匯總
異構(gòu)數(shù)據(jù)源關(guān)聯(lián)
行/列互換
靜態(tài)/動(dòng)態(tài)/條件Lookup
ETL事務(wù)處理
自定義
Pre SQL和Post SQL
數(shù)據(jù)源為文件列表
斷點(diǎn)續(xù)傳
多目標(biāo)表約束裝載
錯(cuò)誤數(shù)量控制
FTP源和FTP目標(biāo)
ETL任務(wù)分區(qū)
增量匯總
測(cè)試裝載
Bulk Loading
External Loading
多層 workflow 嵌套
復(fù)雜組件Mapping邏輯
調(diào)用存儲(chǔ)過(guò)程/外部過(guò)程
Custom Transformation
可視化Debugger
強(qiáng)大的函數(shù)支持,功能豐富的轉(zhuǎn)換語(yǔ)言
功能豐富的Workflow 控制
任務(wù)串行,并行控制
基于時(shí)間,事件和指示文件觸發(fā)任務(wù)
Workflow中調(diào)用操作系統(tǒng)外部命令
Workflow中調(diào)用Email
多ETL Server協(xié)同工作
Informatica PowerCenter其他附加功能
Metadata Exchange
以XML的方式進(jìn)行導(dǎo)入/導(dǎo)出元數(shù)據(jù),和Informatica Repository同步,進(jìn)行元數(shù)據(jù)交換
Team-based Development
團(tuán)隊(duì)開(kāi)發(fā),對(duì)象版本控制,將check in, check out,并且可以以對(duì)象為單位部署,查詢對(duì)象信息。
Partitioning
針對(duì)每一個(gè)session ,缺省的只有一個(gè)進(jìn)程實(shí)現(xiàn)ETL操作,當(dāng)選擇了partition之后,用戶可以指定partition的個(gè)數(shù)和類型,從而實(shí)現(xiàn)多進(jìn)程并發(fā)執(zhí)行,ETL的性能就會(huì)顯著提高。
Server Grid
PowerCenter以一種靈活的方式,提供將異類服務(wù)器聚合在一起分布工作和負(fù)載均衡,通過(guò)不同的Server分配workflows和sessions.
優(yōu)點(diǎn)是:
均衡加載任務(wù)
更容易規(guī)劃資源
提供不同層次的控制
session 級(jí)
workflow級(jí)
server級(jí)
Real-Time
實(shí)時(shí)的數(shù)據(jù)整合平臺(tái)
雙向的,實(shí)時(shí)數(shù)據(jù)集成事務(wù)數(shù)據(jù)或時(shí)間切片數(shù)據(jù)
實(shí)時(shí)的,永遠(yuǎn)開(kāi)通的會(huì)話,可以連續(xù)集成來(lái)自 /消息隊(duì)列的數(shù)據(jù)流
對(duì)于需要立即處理的,實(shí)施的流式傳遞數(shù)據(jù)進(jìn)行零延時(shí)數(shù)據(jù)傳輸
Data profiling
收集數(shù)據(jù)源的相關(guān)信息,并根據(jù)規(guī)則形成分析報(bào)告,從而達(dá)到數(shù)據(jù)探查的目的。
Data Quality
根據(jù)Data profiling的探查結(jié)果,進(jìn)行相應(yīng)的清洗,合并,重構(gòu)等操作,包括以下幾類:
數(shù)據(jù)內(nèi)容錯(cuò)誤
缺失數(shù)據(jù)
無(wú)效數(shù)據(jù)
冗余數(shù)據(jù)
數(shù)據(jù)結(jié)構(gòu)問(wèn)題
無(wú)效鍵值
數(shù)據(jù)矛盾
同一數(shù)據(jù)元素多種格式
同一代碼值不同意思
同一意思多種代碼值
效率驅(qū)動(dòng)。管理變化。確保準(zhǔn)確
數(shù)據(jù)集成服務(wù)
以批處理,實(shí)時(shí)和變化數(shù)據(jù)捕獲進(jìn)行數(shù)據(jù)遷移
數(shù)據(jù)檢查
數(shù)據(jù)清洗
數(shù)據(jù)轉(zhuǎn)換
數(shù)據(jù)聚合
轉(zhuǎn)換服務(wù)
專注數(shù)據(jù)質(zhì)量轉(zhuǎn)換
強(qiáng)大的轉(zhuǎn)換庫(kù)
預(yù)定義的映射和向?qū)?BR>內(nèi)置的源分析
實(shí)時(shí)和批處理數(shù)據(jù)映射的圖形界面
設(shè)置和改變數(shù)據(jù)聚合
可擴(kuò)展轉(zhuǎn)換
連通性服務(wù)
本地支持關(guān)系型的,主機(jī)和IBM iSeries(AS/400)數(shù)據(jù)庫(kù)
本地支持EAI和Messaging
支持形成的集成標(biāo)準(zhǔn),比如XML, Web Services(WSDL, SOAP, UDDI)
連通性SDK
安全服務(wù)
基于角色和權(quán)限的安全
LDAP鑒定
為其他鑒定的安全
系統(tǒng)訪問(wèn)跟蹤
以RSA編密碼方式安全傳輸數(shù)據(jù)
積極的元數(shù)據(jù)
專一的,開(kāi)放的資料庫(kù)
基于WEB的元數(shù)據(jù)分析
可重復(fù)使用的元數(shù)據(jù)對(duì)象
總是保持自己最新的文檔
碰撞分析,數(shù)據(jù)血統(tǒng)分析,依賴影響分析
可擴(kuò)展的元數(shù)據(jù)對(duì)象
雙向元數(shù)據(jù)交換
全球和本地元數(shù)據(jù)管理
可擴(kuò)展平臺(tái)
開(kāi)放,面向服務(wù)的架構(gòu)
客戶端,資料庫(kù)和server SDKs和APIs
支持工業(yè)標(biāo)準(zhǔn),比如Java
商業(yè)智能界面和數(shù)據(jù)模型工具
提供豐富的SDKs和APIs