AI 資料治理策略中應包含的 7 個關鍵組成部分

在追求人工智慧治理策略的過程中,有各種各樣的組織,他們在某個業務領域累積資料和人工智慧項目,以及那些試圖滿足他們的人工智慧要求的組織,以及那些建構人工智慧的組織。

目前,很少有組織擁有經過精心調整的人工智慧工廠,可以對人工智慧數據進行分類、分析和認證,並產生不斷進步的人工智慧見解,更不用說顛覆業務了。但我每週會見的大多數資料領導者都在努力讓他們的資料倉儲井井有條並定義人工智慧策略。歸根究底,人工智慧提供了一個充滿無限可能性的創意新世界,我們有機會塑造這一圖景,而不是讓人工智慧塑造我們。

已經實施某種資料目錄的組織肯定走在人工智慧列車的前面。他們的數據已經過建模、分類、整理和圖表化。目錄供應商正在憑藉許多超出管理數據範圍的新功能競相走在最前沿,但毫無疑問,這些核心功能是精心烘焙的蛋糕的主要成分,一定會讓您的人工智能見解和結果滿意。觀察數據管道、對數據進行評分、貨幣化和市場功能等新的目錄用例正在創建精明的數據社區和數據領導者,他們可以專注於利用人工智能結果和結果採取後續步驟,而不是數據清理和龐大的遷移工作。歸根究底,數據在定義明確、準確、結構化的數據上表現最佳。

在製定策略來準備資料以供人工智慧使用時,以下是可以應用的七種最佳實踐。

1. 預先定義新的人工智慧交付成果的結果和特徵

重要的是要具體說明新的人工智慧交付成果的意圖——概述問題以及對你想要實現的答案的期望。從某種意義上說,您希望成為“快速專家”,學習提出定義性問題的新方式和方法,從而縮小主題範圍,以與人工智慧模型的目標保持一致。這樣,當您觀察資料時,您試圖實現的結果將在您接受或拒絕資料異常時受到監控和調整。

利用資料建模來概述任何新的人工智慧用例的資料要求。建築師資料庫 這就是新的“數據產品”發揮作用的地方。 當商業消費者向資料工程師詢問「我需要用於新行銷活動、新產品、新研究的數據」等時,他們要求提供所有可用的數據資產來幫助他們實施新計劃。這可能是現有的數據集、報告和人工智慧功能,以及他們在使用所述數據時需要注意的任何護欄(政策和指南)。數據產品實現了成功的一個非常重要的因素——將商業消費者與數據專家結合起來,以獲得豐富的體驗並產生共鳴。

 

建築師資料庫

2. 向您的分析社群提供自助數據

搜尋和請求分析資料不需要 IT 工作訂單。可靠的數據目錄市場應該是一種有趣的協作體驗,透過簡單的方法為任何數據消費者帶來數據。考慮提供類似亞馬遜的購物體驗,最終用戶可以比較和發現相關數據集,使用多個數據集創建新的數據產品,並在數據評分和問題線程上進行協作。這在不知不覺中成為管理數據。

當你建立人工智慧時,你並不總是需要金星數據,因為你會耗盡數據。但您始終需要了解資料特徵。特別是當您可能使用合成資料時,您需要知道該資料是內部建立的。數據從哪裡來?這些數據的使用頻率如何?這些數據的受歡迎程度如何?這些數據是否已經被分析過?如果是,它是否達到了我們作為一個組織所接受的誠信水平?

也許使用低於平均的數據來產生更全面的見解是可以的。也許您需要精確且完全準確,因為這涉及監管資訊。確定您的資料必須滿足的品質以及在每種情況下如何使用資料的參數。

分析市場請求本身俱有強制性屬性,用於定義目前用於什麼業務計劃、預期結果和見解是什麼,以及業務的哪個領域將監控該模型的資料管道等。整理和管理的內部、外部和第三方資料的網關。

3. 將資料環境分類

大多數法學碩士和人工智慧模型需要指向與正在產生的見解相關的數據的子部分或領域。如果您將法學碩士和模型指向整個資料領域,則不太可能找到與您的模型相關的資料模式和見解。你的整個模型都面臨著永遠的風險

使其投入生產。

資料目錄將為您對資料進行分類,以便您可以將 AI 模型指向客戶、產品和/或銷售資料等。受管理的目錄將為您提供更多信息,例如質量特徵、數據的受歡迎程度和使用程度以及使用該數據的先前結果。

如果您試圖將人工智慧模型和法學碩士分解為更小、2024 年母親節電子郵件行銷活動的 5 個技巧 更可用的部分,高度機密的數據目錄將為您分解數據。這可以加快您的搜尋速度,並消除尋找相關數據來為模型提供數據的猜測工作。

如果您要劃分人工智慧背後的數據,您會對使用數據管道來管理和監控數據損失和輸出印象深刻。 AI 管道提供了一個透明且可操作的視圖,可以近乎即時地準確了解 AI 模型所發生的情況。透過個人資訊、轉換規則和資料品質分析結果所突顯的資料流視覺化,成為產生模型輸出所需內容的快速地圖。資料品質引擎定期監控這些管道的資料漂移、資料異常、敏感資料和資料降級。

資料分類的另一個關鍵是語意增強。在資料分析功能中使用語意增強可以在您分析資料時自動執行建立業務名稱的流程。當資料品質模組基於您的資料目錄時,您已經擁有執行此增強操作的業務資產。這成為一種從已受監管的目錄中標記關鍵資料元素、個人資訊和監管資料的方法。結合資料分析結果、治理、資料使用和最終用戶排名,將資料分類為金級、銀級和銅級,代表資料的相對價值。

4. 制定強大的人工智慧治理框架

目前全球範圍內的人工智慧治理法規已迅速成為全球焦點,反映出創新、道德考量、公共安全和競爭性經濟利益之間的複雜平衡。為此,組織必須建立內部實踐和政策,以滿足多樣化的、有時甚至是相互衝突的監管要求。現在比以往任何時候都更需要建立強大的人工智慧治理框架。

公司需要確保其人工智慧治理框架已準備好:

響應複雜且不斷變化的人工智慧政策和要求
檢測演算法的公平性和偏差
確保人工智慧實踐道德且透明
開發專注於適應性和未來監管的靈活敏捷的技術
參與產業合作,例如全球人工智慧合作夥伴關係 (GPAI)
這個框架應該是道德和風險的基礎。從一開始就明確你做人工智慧的原因,而不僅僅是因為它很酷。道德與組織文化息息相關,您的人工智慧策略在道德方面需要知情且透明。這將發展為個人如何對其人工智慧進行編程並選擇要包含的資料類型。觀察資料和警報可以成為您對已更改的資料採取行動的基礎。因此,請務必進行事實檢查,以保持模型的真實目的和意圖。很多時候,道德可以成為區分事實與虛構的手段。

歸根結底,減少偏見是很困難的,因為人類無法發現自己的偏見,甚至不知道該去哪裡尋找。正如普立茲獎得主行為經濟學家丹尼爾‧卡尼曼在《噪音:人類判斷力的缺陷》一書中所說,「行為經濟學揭示了偏見盲點。發現偏見是人工智慧使用面臨的最有趣的問題之一,因為它需要社會科學和計算機科學來解決。

由於數據變化如此之快,組織中的許多部門要求為人工智慧提供自助數據服務,因此人工智慧框架必須與他們正在使用的技術相適應。

從風險角度進行規格要求您識別並揭露新的人工智慧模型或法學碩士可能為您的組織帶來的風險等級。它是低風險、中風險還是高風險計劃?例如,我們看到客戶需要快速自動化例程對特定表和視圖執行資料驗證。這意味著掃描表格以識別關鍵、敏感資料並將其從人工智慧輸入中排除。或者可能選擇保留敏感數據,但將其標記為敏感數據,並包括如何使用此數據的實際策略和業務規則。

這些都是目錄應該支援的基本功能,許多目錄正在投資進一步的功能,以透過警報和提示變得更加主動和個性化,以免被人錯過或繞過。

您希望定義和執行資料管理、存取控制和使用方面的政策,熱門資料庫 以符合即將出台的人工智慧法規並促進負責任的人工智慧使用。當數據和人工智慧團隊可以確保數據

資源值得信賴,數據安全,公司正在使用一致的指標和定義進行高級報告,這讓數據消費者有信心在該框架內自由存取和利用數據。

5.觀察人工智慧模型以消除偏見

設計並定期觀察為模型提供數據的數據,以輕鬆識別導致偏差的異常情況和錯過的數據完整性閾值,確保用於 AI 的數據具有代表性、合乎道德且不存在偏見。這需要近乎即時地完成。內建資料品質組件的目錄最擅長這一點。您可能有一個數據品質解決方案,可以一點一點地分析數據,但如果您沒有提供整體情況的目錄,您將只能監控數據品質工具所了解的內容。如果您的目錄沒有數據質量,您將無法透明地了解好數據、壞數據和未測量數據的傳播位置,也無法直接引導您回到髒數據的真正來源。

數據經常變化,是流動的。當您設定資料閾值時,系統會自動提醒您資料高於或低於您為該資料設定的最小值或最大值。當您看到資料中的峰值時,您將能夠接受或拒絕這些峰值。本質上,你正在訓練人工智慧模型背後的資料。也許您正在觀察新產品背後的定價。如果某個地區的價格因為最近的事件(颶風、大流行等)而飆升,您可能希望也可能不希望您的 AI 模型考慮這種異常情況。如果需要三個多月的時間才能了解人工智慧模型產生的資料存在某種模式,那麼您可能需要拒絕一切正常的業務。另一方面,在沒有觀察和訓練的情況下放任資料可能會導致大量峰值,導致模型變得無用,沒有明確的見解或學習。

現代數據品質解決方案提供業務儀表板和視圖。在資料分析中將考慮業務定義和規則。將其與目錄結合,您就擁有了一個一站式市場來追蹤、追蹤和提供任何分析程序或專案都信任的數據。

6. 對你的人工智慧進行評分和認證

讓組織與您一起踏上人工智慧之旅的一部分是讓您的數據消費者參與角色和行動。也許有一個資料成熟度模型概述了您需要採取哪些步驟來驗證您正在使用可信任資料。確定該人工智慧模型在發布之前需要具備哪些條件才能投入生產。將其與您的新人工智慧模型連結起來,您就擁有了人工智慧認證流程。這應該可以幫助您在晚上入睡。

您的資料和治理是否已為 AI 做好準備?
您的資料和治理是
人工智慧準備好了嗎?
限制風險並確保資料合規、可信和可靠。
透過 Quest 了解 erwin
數據評分通常包括最終用戶評分、數據品質分析結果和最終用戶排名。 這些通常是將您的目錄資料分類為黃金、白銀和青銅資料集或產品的方面。我並不是說不要使用青銅數據,而是要知道其中的風險以及為什麼它尚未被歸類為黃金數據。這還可以讓您了解哪些地方容易受到尚未分類或剖析的數據的影響。

無論採用何種策略,都要大處著眼,從小處著手,快速擴大規模。

7. 人工智慧培訓
不要忘記對您的數據和用戶社群進行人工智慧本身的培訓。如果沒有培訓,問題和曝光就會醞釀。對使用者進行即時工程、人工智慧風險和法規以及資料素養的培訓將消除恐懼,並使組織團結起來迎接人工智慧的下一個新視野。

結論

資料管理能力的徹底變革,帶來了資料透明的迫切呼聲。數據透明度和一個值得信賴的地方(即:內部市場)供您的 D&A 用戶自助服務其所有數據需求,這將使您的組織能夠「數據就緒」。資料模型、元資料目錄、資料品質工具和業務術語表都是讓您的資料屋井井有條的良好開端,但在應用這些功能時,您需要其中每一項功能的一部分與AI 一起工作來為您提供幫助端到端用例。要走在人工智慧列車的前面,需要現實一點,那就是再次將上下文與數據結合起來,並在整個人工智慧生命週期中管理該上下文。

返回頂端