什么是AI

AI(人工智能)是通過(guò)機(jī)器來(lái)模擬人類(lèi)認(rèn)識(shí)能力的一種科技能力。AI最核心的能力就是根據(jù)給定的輸入做出判斷或預(yù)測(cè)。

AI開(kāi)發(fā)的目的是什么

AI開(kāi)發(fā)的目的是將隱藏在一大批數(shù)據(jù)背后的信息集中處理并進(jìn)行提煉,從而總結(jié)得到研究對(duì)象的內(nèi)在規(guī)律。

對(duì)數(shù)據(jù)進(jìn)行分析,一般通過(guò)使用適當(dāng)?shù)慕y(tǒng)計(jì)、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等方法,對(duì)收集的大量數(shù)據(jù)進(jìn)行計(jì)算、分析、匯總和整理,以求最大化地開(kāi)發(fā)數(shù)據(jù)價(jià)值,發(fā)揮數(shù)據(jù)作用。

AI開(kāi)發(fā)的基本流程

AI開(kāi)發(fā)的基本流程通常可以歸納為幾個(gè)步驟:確定目的、準(zhǔn)備數(shù)據(jù)、訓(xùn)練模型、評(píng)估模型、部署模型。

圖1 AI開(kāi)發(fā)流程

  1. 確定目的


    在開(kāi)始AI開(kāi)發(fā)之前,必須明確要分析什么?要解決什么問(wèn)題?商業(yè)目的是什么?基于商業(yè)的理解,整理AI開(kāi)發(fā)框架和思路。例如,圖像分類(lèi)、物體檢測(cè)等等。不同的項(xiàng)目對(duì)數(shù)據(jù)的要求,使用的AI開(kāi)發(fā)手段也是不一樣的。


  2. 準(zhǔn)備數(shù)據(jù)


    數(shù)據(jù)準(zhǔn)備主要是指收集和預(yù)處理數(shù)據(jù)的過(guò)程。

    按照確定的分析目的,有目的性的收集、整合相關(guān)數(shù)據(jù),數(shù)據(jù)準(zhǔn)備是AI開(kāi)發(fā)的一個(gè)基礎(chǔ)。此時(shí)最重要的是保證獲取數(shù)據(jù)的真實(shí)可靠性。而事實(shí)上,不能一次性將所有數(shù)據(jù)都采集全,因此,在數(shù)據(jù)標(biāo)注階段你可能會(huì)發(fā)現(xiàn)還缺少某一部分?jǐn)?shù)據(jù)源,反復(fù)調(diào)整優(yōu)化。


  3. 訓(xùn)練模型


    俗稱(chēng)“建?!保竿ㄟ^(guò)分析手段、方法和技巧對(duì)準(zhǔn)備好的數(shù)據(jù)進(jìn)行探索分析,從中發(fā)現(xiàn)因果關(guān)系、內(nèi)部聯(lián)系和業(yè)務(wù)規(guī)律,為商業(yè)目的提供決策參考。訓(xùn)練模型的結(jié)果通常是一個(gè)或多個(gè)機(jī)器學(xué)習(xí)或深度學(xué)習(xí)模型,模型可以應(yīng)用到新的數(shù)據(jù)中,得到預(yù)測(cè)、評(píng)價(jià)等結(jié)果。

    業(yè)界主流的AI引擎有TensorFlow、PyTorch、MindSpore等,大量的開(kāi)發(fā)者基于主流AI引擎,開(kāi)發(fā)并訓(xùn)練其業(yè)務(wù)所需的模型。


  4. 評(píng)估模型


    訓(xùn)練得到模型之后,整個(gè)開(kāi)發(fā)過(guò)程還不算結(jié)束,需要對(duì)模型進(jìn)行評(píng)估和考察。往往不能一次性獲得一個(gè)滿(mǎn)意的模型,需要反復(fù)的調(diào)整算法參數(shù)、數(shù)據(jù),不斷評(píng)估訓(xùn)練生成的模型。

    一些常用的指標(biāo),如準(zhǔn)確率、召回率、AUC等,能幫助您有效的評(píng)估,最終獲得一個(gè)滿(mǎn)意的模型。


  5. 部署模型


    模型的開(kāi)發(fā)訓(xùn)練,是基于之前的已有數(shù)據(jù)(有可能是測(cè)試數(shù)據(jù)),而在得到一個(gè)滿(mǎn)意的模型之后,需要將其應(yīng)用到正式的實(shí)際數(shù)據(jù)或新產(chǎn)生數(shù)據(jù)中,進(jìn)行預(yù)測(cè)、評(píng)價(jià)、或以可視化和報(bào)表的形式把數(shù)據(jù)中的高價(jià)值信息以精辟易懂的形式提供給決策人員,幫助其制定更加正確的商業(yè)策略。