1. 分類標(biāo)注:就是常見的打標(biāo)簽。一般是從既定的標(biāo)簽中選擇數(shù)據(jù)對應(yīng)的標(biāo)簽,一張圖就可以有很多分類 / 標(biāo)簽:成人、女、黃種人、長發(fā)等。對于文字,可以標(biāo)注主語、謂語、賓語,名詞動詞等。
適用:文本、圖像、語音、視頻
應(yīng)用:臉齡識別,情緒識別,性別識別
2. 標(biāo)框標(biāo)注:就是框選要檢測的對象。如人臉識別,首先要先把人臉的位置確定下來。
適用:圖像
應(yīng)用:人臉識別,物品識別
3. 區(qū)域標(biāo)注:區(qū)域標(biāo)注要求更加精確。邊緣可以是柔性的。如自動駕駛中的道路識別。
應(yīng)用:自動駕駛
4. 描點(diǎn)標(biāo)注:一些對于特征要求細(xì)致的應(yīng)用中常常需要描點(diǎn)標(biāo)注。
應(yīng)用:人臉識別、骨骼識別
5. 其他標(biāo)注:標(biāo)注的類型除了上面幾種常見的,還有很多個性化的。根據(jù)不同的需求則需要不同的標(biāo)注。
數(shù)據(jù)標(biāo)注的過程
1. 標(biāo)注標(biāo)準(zhǔn)的確定
確定好標(biāo)準(zhǔn)是保證數(shù)據(jù)質(zhì)量的關(guān)鍵一步,要保證有個可以參照的標(biāo)準(zhǔn)。一般可以:
設(shè)置標(biāo)注樣例、模板。例如顏色的標(biāo)準(zhǔn)比色卡。
對于模棱兩可的數(shù)據(jù),設(shè)置統(tǒng)一處理方式,如可以棄用,或者統(tǒng)一標(biāo)注。
參照的標(biāo)準(zhǔn)有時候還要考慮行業(yè)。以文本情感分析為例,“疤痕” 一詞,在心理學(xué)行業(yè)中,可能是個負(fù)面詞,而在醫(yī)療行業(yè)則是一個中性詞。
2. 標(biāo)注形式的確定
標(biāo)注形式一般由算法人員制定,例如某些文本標(biāo)注,問句識別,只需要對句子進(jìn)行 0 或 1 的標(biāo)注。是問句就標(biāo) 1,不是問句就標(biāo) 0。
3. 標(biāo)注工具的選擇
標(biāo)注的形式確定后,就是對標(biāo)注工具的選擇了。一般也是由算法人員提供。大公司可能會內(nèi)部開發(fā)一個專門用于數(shù)據(jù)標(biāo)注的可視化工具。