《經濟學人》(The Economist)將數據類比為21世紀的石油,但石油是不能直接使用的,需要經過複雜的煉製過程才能成為可以被利用的資源。同樣,非結構化的原始數據也是無法直接使用的,需要根據使用者的需要進行加工。數據加工能夠幫助研究者構建更加精確的數據集,提高數據可用性,為數據資源的挖掘和分析奠定基礎。數據加工主要包括數據清洗、數據標註、數據審核以及數據融合處理等方式。其中,對於AI建模而言,最重要的數據加工環節是將非結構化數據中有用的部分標記出來,轉變為計算機可以理解的結構化數據,亦即數據標註。\大公報整理
领取专属 10元无门槛券
私享最新 技术干货