7月底,江西迎來(lái)高溫紅色預(yù)警,新余的最高氣溫已經(jīng)超過(guò)40攝氏度,早上剛過(guò)8點(diǎn),陽(yáng)光就變得毒辣,穿過(guò)玻璃窗照射在上億廣場(chǎng)三樓的辦公區(qū)域。
臨近9點(diǎn),這里逐漸熱鬧起來(lái),各作業(yè)區(qū)的打卡電腦前排起了長(zhǎng)隊(duì),摘掉口罩、人臉識(shí)別、打卡成功……500多名人工智能訓(xùn)練師陸續(xù)走到自己的工位,準(zhǔn)備開(kāi)始一天的工作。
“90后”二胎寶媽湯麗娟就是其中一員,只見(jiàn)她全神貫注地盯著電腦屏幕,左手操作鍵盤(pán),右手移動(dòng)鼠標(biāo),先畫(huà)出一輛車(chē)的大體輪廓,然后將圖片放至最大,細(xì)心調(diào)整車(chē)輛邊緣的框線(xiàn),再勾選屏幕左上角的車(chē)輛屬性。
“這樣一整套流程下來(lái),就標(biāo)注好了這輛車(chē)的信息。”湯麗娟邊操作電腦,邊向中國(guó)婦女報(bào)全媒體記者介紹,“我們的工作主要就是在這些圖像上標(biāo)注數(shù)據(jù),讓人工智能可以通過(guò)這些數(shù)據(jù)更好地認(rèn)識(shí)世界,從而為人類(lèi)服務(wù)。”
“先嘗試,才知道自己行不行”
在人社部公布的國(guó)家職業(yè)分類(lèi)目錄中,湯麗娟從事的職業(yè)被認(rèn)定為“人工智能訓(xùn)練師”(AI訓(xùn)練師),指使用智能訓(xùn)練軟件,在人工智能產(chǎn)品實(shí)際使用過(guò)程中進(jìn)行數(shù)據(jù)庫(kù)管理、算法參數(shù)設(shè)置、人機(jī)交互設(shè)計(jì)、性能測(cè)試跟蹤及其他輔助作業(yè)的人員,包含數(shù)據(jù)標(biāo)注員、人工智能算法測(cè)試員兩個(gè)工種。
“這些話(huà)聽(tīng)起來(lái)很專(zhuān)業(yè),但數(shù)據(jù)標(biāo)注這個(gè)過(guò)程其實(shí)和平時(shí)帶孩子有點(diǎn)像。”從業(yè)兩個(gè)多月,湯麗娟對(duì)這份工作有著自己的理解,“我們就像一個(gè)‘翻譯’,把采集到的圖像、語(yǔ)音或視頻‘翻譯’成計(jì)算機(jī)語(yǔ)言,人工智能就像孩子,我們要不斷用它能聽(tīng)懂的結(jié)構(gòu)化語(yǔ)言帶它熟悉真實(shí)世界,比如把障礙物、紅綠燈、車(chē)道線(xiàn)等數(shù)據(jù)標(biāo)注好了,人工智能就會(huì)通過(guò)這些信息慢慢學(xué)會(huì)自動(dòng)駕駛。”
說(shuō)著,湯麗娟又完成了一幀畫(huà)面的標(biāo)注??粗龐故斓牟僮?,很難想象這位寶媽是一名才工作兩個(gè)月的跨界新手。

湯麗娟(右一)在和同事討論標(biāo)注細(xì)節(jié)。中國(guó)婦女報(bào)全媒體記者劉昱卓/攝
湯麗娟形容自己是個(gè)“愛(ài)折騰”的人,畢業(yè)十年間,她曾去過(guò)武漢、上海、杭州,做過(guò)和自己大學(xué)專(zhuān)業(yè)相關(guān)的針灸推拿工作,也曾因自己的進(jìn)修計(jì)劃從事過(guò)留學(xué)行業(yè),回到新余之前,她在杭州做獵頭。
“我不喜歡給自己設(shè)限制,只要能通過(guò)面試,我都會(huì)盡力去試試。”這是湯麗娟的人生哲學(xué),成為人工智能訓(xùn)練師,也得益于這種不斷嘗試的勇氣。
最初看招聘信息時(shí),她敏銳地捕捉到了“人工智能”“語(yǔ)音識(shí)別”“自動(dòng)駕駛”這些如今正火的關(guān)鍵詞,本來(lái)還擔(dān)心自己做不好,但看到身邊的應(yīng)屆畢業(yè)生、寶媽們都能做,湯麗娟一下有了信心,“先去嘗試,才知道自己行不行”。
百度智能云數(shù)據(jù)標(biāo)注基地合作負(fù)責(zé)人魏冬告訴記者,基地中應(yīng)屆畢業(yè)生占比近兩成,正式上手工作前會(huì)對(duì)員工進(jìn)行整體的職業(yè)培訓(xùn),使大家對(duì)人工智能產(chǎn)業(yè)鏈及自身的工種有整體認(rèn)知,在每個(gè)項(xiàng)目開(kāi)始前,也會(huì)對(duì)成員進(jìn)行具體的業(yè)務(wù)培訓(xùn),來(lái)幫助大家熟悉工作流程。
通過(guò)考試進(jìn)入項(xiàng)目后,每個(gè)人每天要完成特定數(shù)量的標(biāo)注任務(wù)。上班時(shí)間,基地作業(yè)區(qū)充斥著移動(dòng)鼠標(biāo)的聲音,同事們偶爾起身到對(duì)方的屏幕前交談幾句,也會(huì)有審核的小組長(zhǎng)來(lái)提返修意見(jiàn)。
“在不斷實(shí)踐中提升正確率”
畫(huà)框、放大畫(huà)面、調(diào)整框線(xiàn)、提交審核……下午一點(diǎn)半,湯麗娟回家吃過(guò)午飯后,重新坐在電腦前重復(fù)上午的操作,這樣的矩形框,她每天要畫(huà)600到1000個(gè)。
有時(shí)候,她覺(jué)得自己像工廠(chǎng)流水線(xiàn)上的一顆螺絲釘,每天坐在電腦前8個(gè)小時(shí),在單一的工作場(chǎng)景中完成規(guī)定數(shù)量的任務(wù)。但在看似枯燥重復(fù)的操作中,她也收獲了成長(zhǎng)。
剛進(jìn)項(xiàng)目時(shí),湯麗娟每天只能處理100個(gè)矩形框,而且有一半都不能通過(guò)審核,“有一次,我在畫(huà)面上標(biāo)注了十幾輛車(chē),但審核回來(lái)發(fā)現(xiàn)標(biāo)注錯(cuò)誤的紅色小圈就有二三十個(gè),比車(chē)還多。”湯麗娟回憶起收到審核結(jié)果的那一刻,“真的是深感挫敗,明明認(rèn)真標(biāo)注了,結(jié)果卻不盡如人意。”
她點(diǎn)開(kāi)每一個(gè)紅色小圓圈,一一記錄著出錯(cuò)的地方。不知道如何改正的,她及時(shí)和同事討論、向老師請(qǐng)教。時(shí)間長(zhǎng)了,湯麗娟心里像裝著一個(gè)錯(cuò)題本。
“畫(huà)矩形框或者立體框的時(shí)候,要盡可能貼合車(chē)身,比如車(chē)窗玻璃和車(chē)身最高點(diǎn)的接縫處,誤差要控制在兩個(gè)像素以?xún)?nèi)才算合格。”
“選擇車(chē)輛屬性的時(shí)候,經(jīng)常選完上一輛車(chē)的,就忘記修改了。”
“最難的是適當(dāng)腦補(bǔ),比如照片上只能看到車(chē)尾,但每個(gè)人對(duì)車(chē)頭的想象都不同,就會(huì)導(dǎo)致標(biāo)注出來(lái)的框線(xiàn)有很大差別。”
……
“細(xì)心、熟練、多交流”,這是湯麗娟不斷提升標(biāo)注正確率的三大法寶,經(jīng)過(guò)兩個(gè)月的實(shí)踐,她標(biāo)注的正確率已經(jīng)從不足50%提升至85%左右,“在不斷實(shí)踐中提升正確率,讓我很有成就感!”湯麗娟說(shuō)。
AI訓(xùn)練師被稱(chēng)為人工智能的“老師”,湯麗娟覺(jué)得這個(gè)比喻十分貼切,“為數(shù)據(jù)貼上標(biāo)簽就是為了讓AI機(jī)器人更容易識(shí)別數(shù)據(jù),通過(guò)數(shù)據(jù)更好地認(rèn)識(shí)這個(gè)世界。”每次標(biāo)注的正確率有所提升,她都覺(jué)得人工智能離感知真實(shí)世界又近了一步。
“感激新基建催生新職業(yè)、新平臺(tái)”
今年5月,新余市政府引進(jìn)百度智能云數(shù)據(jù)標(biāo)注產(chǎn)業(yè),在上億廣場(chǎng)三樓建立了7000多平方米的基地,如今,基地展廳大屏上的保護(hù)膜甚至還沒(méi)來(lái)得及撕掉,各作業(yè)區(qū)已經(jīng)坐滿(mǎn)了員工。
魏冬介紹,基地員工中近80%為新余本地人。數(shù)據(jù)標(biāo)注基地的建成,構(gòu)建起了通往新一代信息技術(shù)的橋梁,幫助傳統(tǒng)行業(yè)從業(yè)者更好實(shí)現(xiàn)職業(yè)轉(zhuǎn)型,同時(shí)吸收大量應(yīng)屆畢業(yè)生、寶媽等勞動(dòng)力,為這座城市提供了近千個(gè)就業(yè)崗位。
湯麗娟就是實(shí)實(shí)在在的受益者,原來(lái)的她從未想過(guò),生完二胎重回職場(chǎng)能從事這樣一份工作,“離家很近,不用加班,可以拿到高于新余平均水平的工資。”
而且,湯麗娟十分認(rèn)可這份工作的未來(lái)發(fā)展,她知道,隨著人工智能在智慧城市、智能制造、自動(dòng)駕駛等各行各業(yè)的廣泛應(yīng)用,社會(huì)對(duì)人工智能訓(xùn)練師的需求將迎來(lái)爆發(fā)式增長(zhǎng)。據(jù)人社部預(yù)計(jì),2022年國(guó)內(nèi)外相關(guān)從業(yè)人員有望達(dá)到500萬(wàn)。
最近,湯麗娟收到一個(gè)好消息,因?yàn)橹暗捻?xiàng)目數(shù)據(jù)斷檔,公司安排她去新項(xiàng)目做小組長(zhǎng)。從“行業(yè)小白”到“8人項(xiàng)目小組長(zhǎng)”,湯麗娟說(shuō):“我很慶幸自己的選擇和努力,更感激新基建催生的新職業(yè)、新平臺(tái)。”
“這對(duì)我來(lái)說(shuō)是很大的肯定。”在基地,湯麗娟看到了未來(lái)清晰的成長(zhǎng)路徑,“數(shù)據(jù)標(biāo)注員可以通過(guò)提升標(biāo)注正確率成為審核員,進(jìn)而晉升為項(xiàng)目助理,直到獨(dú)立負(fù)責(zé)一個(gè)完整的項(xiàng)目。或者像我一樣,從標(biāo)注員到小組長(zhǎng),繼續(xù)做到項(xiàng)目經(jīng)理,幸運(yùn)的話(huà)甚至能成為公司合伙人。”
更讓湯麗娟感到滿(mǎn)足和驕傲的,是看到家鄉(xiāng)的道路上穩(wěn)穩(wěn)行駛著無(wú)人駕駛公交車(chē),“以前只覺(jué)得是高科技,現(xiàn)在每次見(jiàn)到,都會(huì)指給孩子看,告訴他‘媽媽的工作和這個(gè)有關(guān)’。”
/記者手記/
近年來(lái),隨著人工智能的快速發(fā)展,以前在電影中才能看到的高科技場(chǎng)面,越來(lái)越多地出現(xiàn)在現(xiàn)實(shí)生活中。到餐廳吃飯,上菜的人變成了送餐機(jī)器人;去超市買(mǎi)東西,收銀臺(tái)設(shè)置了自助結(jié)賬機(jī)器;走上街頭,無(wú)人駕駛的公交車(chē)在路面上穩(wěn)穩(wěn)行駛……人工智能的確強(qiáng)大,但這條產(chǎn)業(yè)鏈的基礎(chǔ),其實(shí)是海量雜亂的數(shù)據(jù),而人工智能之所以變得如此聰明,離不開(kāi)人工智能訓(xùn)練師的努力。
湯麗娟就是這樣一位愿意嘗試新事物的人工智能訓(xùn)練師,當(dāng)很多人害怕自己的工作被人工智能替代時(shí),她卻提前轉(zhuǎn)換賽道,承擔(dān)起教人工智能認(rèn)識(shí)世界、更好地為人類(lèi)服務(wù)的使命。
其實(shí),職業(yè)也是不斷跟隨社會(huì)發(fā)展而更新迭代的產(chǎn)物,一些職業(yè)的消失必然會(huì)催生新職業(yè)的需求,比如人工智能要實(shí)現(xiàn)自動(dòng)駕駛,可能會(huì)縮減司機(jī)的需求量,但地圖采集員、數(shù)據(jù)標(biāo)注員等新崗位的需求會(huì)大幅增加。與其擔(dān)心焦慮,不如提前準(zhǔn)備。在這場(chǎng)變革中,湯麗娟用自己的經(jīng)歷告訴大家,或許想進(jìn)入一個(gè)全新的領(lǐng)域并不容易,但先試試,才知道自己行不行。