亞洲資本網(wǎng) > 資訊 > 熱播 > 正文
數(shù)據(jù)標注師:化“人工”為“智能”
2023-08-26 01:55:37來源: 中國青年報

人工智能訓(xùn)練師于2020年正式成為新職業(yè)并納入國家職業(yè)分類目錄。2021年,《人工智能訓(xùn)練師國家職業(yè)技能標準(2021年版)》發(fā)布,數(shù)據(jù)標注員是人工智能訓(xùn)練師的工種之一。


(資料圖片)

——————————

4年前,陳霞還是一名全職媽媽,也從沒想到自己會成為人工智能領(lǐng)域中的一員。如今,31歲的她已經(jīng)是一名資深的數(shù)據(jù)標注師了。

她參與的是無人駕駛項目,負責(zé)在電腦上對車在道路上采集的現(xiàn)實交通場景的原始數(shù)據(jù)進行處理,將其轉(zhuǎn)化為機器學(xué)習(xí)可識別的專業(yè)數(shù)據(jù)。

“比如道路上的各種障礙物、建筑、綠植,各類車道線以及行人等,我們要把這些人、物標出來,我們就是無人駕駛車的眼睛,告訴它們看見的東西是什么,應(yīng)該怎么去行駛?!标愊歼@樣描述著她的工作。

有多少智能,就有多少人工

“數(shù)據(jù)標注是機器感知現(xiàn)實世界的起點,是大部分人工智能算法得以有效運行的關(guān)鍵環(huán)節(jié)?!卑俣戎悄茉茢?shù)據(jù)標注基地業(yè)務(wù)產(chǎn)品負責(zé)人胡馳說,簡單來說,數(shù)據(jù)標注是對未經(jīng)處理的語音、圖片、文本、視頻等數(shù)據(jù)進行特征標簽,將非結(jié)構(gòu)化的數(shù)據(jù)轉(zhuǎn)變?yōu)闄C器可識別的結(jié)構(gòu)化數(shù)據(jù),使機器通過大量學(xué)習(xí)這些數(shù)據(jù),化“人工”為“智能”。

數(shù)據(jù)標注師是伴隨人工智能發(fā)展誕生的新職業(yè),人工智能的進步離不開數(shù)據(jù)的標注。隨著中國人工智能產(chǎn)業(yè)的高速發(fā)展,數(shù)據(jù)標注師這個新職業(yè)的需求及人數(shù)也在壯大。作為人工智能的“啟蒙老師”,數(shù)據(jù)標注行業(yè)流行著一句話,“有多少智能,就有多少人工”。

目前,數(shù)據(jù)標注不僅服務(wù)于自動駕駛行業(yè),還服務(wù)于醫(yī)療保健、智能安防、新零售等場景。

帥雙雙是一名醫(yī)療數(shù)據(jù)標注師,他的工作主要是對醫(yī)療類問答進行標注,糾正生成式人工智能對醫(yī)療相關(guān)問題的解答,主要用于在線問診等場景。他介紹說,“比如向AI提問心臟病的并發(fā)癥有哪些,我們要從它的多個回答中標注出符合問題的選項。有時,AI的回答雖然正確,但是語句不通順、不清晰,我們也要對此進行標注,通過這些操作,綜合培養(yǎng)AI的回答系統(tǒng)?!?/p>

AI技術(shù)的落地應(yīng)用在很大程度上緩解了醫(yī)療資源緊張、地區(qū)分布不均等問題,提升了醫(yī)療體系的整體運行效率。數(shù)據(jù)標注有望在增強人工智能在醫(yī)療保健領(lǐng)域的應(yīng)用方面發(fā)揮重要作用。

胡馳表示,目前,人工智能技術(shù)不斷演化、技術(shù)與行業(yè)場景融合不斷泛化,這些都需要大量的數(shù)據(jù)支撐,會對數(shù)據(jù)產(chǎn)生許多新的需求。數(shù)據(jù)標注也從早期的相對通用數(shù)據(jù)向?qū)I(yè)化、復(fù)雜化方向演進。越來越多的細分場景,需要更多定制化模型進行迭代訓(xùn)練,這也讓數(shù)據(jù)標注師面臨更多考驗,“未來,數(shù)據(jù)標注師會伴隨人工智能的發(fā)展不斷成長與變化,具備較長的職業(yè)生命周期與上升空間?!?/p>

數(shù)據(jù)標注師需求多元化 門檻高低各不同

天眼查數(shù)據(jù)顯示,目前我國有2000余家與“數(shù)據(jù)標注”相關(guān)的公司。其中,成立1-5年的占比24.2%,成立10年以上的占比50.8%。

人工智能訓(xùn)練師于2020年正式成為新職業(yè)并納入國家職業(yè)分類目錄。2021年,《人工智能訓(xùn)練師國家職業(yè)技能標準(2021年版)》發(fā)布,數(shù)據(jù)標注員是人工智能訓(xùn)練師的工種之一。

德勤發(fā)布的《2022年人工智能基礎(chǔ)數(shù)據(jù)服務(wù)白皮書》顯示,2022年中國人工智能基礎(chǔ)數(shù)據(jù)服務(wù)市場規(guī)模為45億元,預(yù)計2027年市場規(guī)模將達到130億-160億元。胡馳認為,人工智能技術(shù)的迅猛發(fā)展,帶來了大量AI算法的訓(xùn)練需求,這推動了數(shù)據(jù)標注產(chǎn)業(yè)的快速增長,人工智能訓(xùn)練師的規(guī)模也由此快速增長。

數(shù)據(jù)標注工具使用戶能夠通過向數(shù)據(jù)添加屬性標簽或?qū)ζ溥M行標記來提高數(shù)據(jù)的價值。使用標注工具的主要好處是數(shù)據(jù)屬性的組合使用戶能夠在單個位置管理數(shù)據(jù)定義,而無需在多個地方重寫類似的規(guī)則。

大數(shù)據(jù)的興起和大型數(shù)據(jù)集數(shù)量的激增,也需要使用人工智能數(shù)據(jù)標注領(lǐng)域的技術(shù)。螞蟻公益基金會副秘書長黃慶委表示,數(shù)據(jù)標注行業(yè)有望受益于對機器學(xué)習(xí)改進需求的不斷增長,以及對先進自動駕駛技術(shù)投資的不斷增加。

對于未來,帥雙雙表示,隨著數(shù)據(jù)行業(yè)的發(fā)展,未來行業(yè)的門檻會越來越高。人工智能應(yīng)用場景在不斷細分,數(shù)據(jù)分類也更加精細化、復(fù)雜化,作為數(shù)據(jù)標注師必須不斷學(xué)習(xí)以滿足行業(yè)發(fā)展需求。

胡馳表示,數(shù)據(jù)標注行業(yè)對人才需求具有多元性,不同的標注數(shù)據(jù)與場景,對人員要求也呈現(xiàn)出一定的梯度分布的特征。較為低階的標注如標點、劃線等,對標注人員的要求往往不高,普通人經(jīng)過培訓(xùn)即可勝任;中高階的標注,如對自動駕駛、大模型等的標注,則對標注人員的要求更高、更專業(yè)。而一些細分復(fù)雜場景可能會需要更專業(yè)、更高學(xué)歷的數(shù)據(jù)標注師來提供數(shù)據(jù)服務(wù)。胡馳認為,“未來,隨著人工智能的不斷發(fā)展,數(shù)據(jù)標注可能將從勞動密集型產(chǎn)業(yè)轉(zhuǎn)向技術(shù)型產(chǎn)業(yè)?!?/p>

中青報·中青網(wǎng)記者 高蕾 來源:中國青年報

關(guān)鍵詞:

專題新聞
  • 恒天海龍(000677.SZ)發(fā)布上半年業(yè)績,凈利潤2507.46萬元,同比下降17.25%
  • 希荻微:擬使用超募資金回購公司股份
  • 2022年我國經(jīng)濟發(fā)展新動能指數(shù)比上年增長28.4%
  • dnf強化武器需要什么材料(dnf強化武器技巧)
  • pws簡稱是什么意思(pws)
  • 《裝甲核心6》登錄平臺匯總
最近更新

京ICP備2021034106號-51

Copyright © 2011-2020  亞洲資本網(wǎng)   All Rights Reserved. 聯(lián)系網(wǎng)站:55 16 53 8 @qq.com