大數(shù)據(jù)挖掘是從大量、不完整、有噪聲、模糊和隨機(jī)的數(shù)據(jù)中提取潛在有用信息和知識(shí)的過程。數(shù)據(jù)挖掘通常與計(jì)算機(jī)科學(xué)相關(guān),它通過統(tǒng)計(jì)分析、在線解析、信息檢索、機(jī)器學(xué)習(xí)算法、專家系統(tǒng)和模式識(shí)別等方法進(jìn)行。
數(shù)據(jù)挖掘過程:
定義問題:明確定義業(yè)務(wù)問題,確定數(shù)據(jù)挖掘的目的。
數(shù)據(jù)準(zhǔn)備:數(shù)據(jù)準(zhǔn)備包括:選擇數(shù)據(jù)-從大型數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)目標(biāo)中提取數(shù)據(jù)挖掘的目標(biāo)數(shù)據(jù)集;數(shù)據(jù)預(yù)處理-數(shù)據(jù)再處理,包括檢查數(shù)據(jù)的完整性和一致性、去除噪音、填充缺失字段、刪除無效數(shù)據(jù)等。
數(shù)據(jù)挖掘:根據(jù)數(shù)據(jù)函數(shù)的類型和數(shù)據(jù)的特點(diǎn),選擇相應(yīng)的算法,對(duì)經(jīng)過凈化和轉(zhuǎn)換的數(shù)據(jù)集進(jìn)行數(shù)據(jù)挖掘。
結(jié)果分析:對(duì)數(shù)據(jù)挖掘的結(jié)果進(jìn)行解釋和評(píng)價(jià),并將其轉(zhuǎn)化為用戶能夠理解的知識(shí)。
@xuefen.com.cn 2013-2022 閩ICP備2023010389號(hào)-3 最近更新