亚洲精品人成网线在播放VA,一区有码中文女同

搜索

APP

起點課堂會員權益

職業(yè)體系課特權

線下行業(yè)大會特權

個人IP打造特權

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導直播

12場專業(yè)技能直播

會員專屬社群

榮耀標識

發(fā)布

注冊 | 登錄

月薪兩萬，大廠瘋搶AI數(shù)據(jù)標注員

自象限

2023-11-30

0 評論 2133 瀏覽 1 收藏

17 分鐘

在最近的招聘市場上，一大波有關“AI數(shù)據(jù)標注員”的崗位開啟了火熱招聘，而這一現(xiàn)象背后，離不開大模型熱與大廠的大模型布局。這篇文章里，作者就做了一定的講述和分析，一起來看一下。

“人均月薪兩萬、本科以上學歷、直通百度字節(jié)?！?/p>

有些許荒涼的年底招聘市場，在最近的短短一周之內，突然冒出了一大批“AI數(shù)據(jù)標注員”的崗位，正在火熱招聘中。

據(jù)「自象限」搜索，這些崗位不僅有百度、字節(jié)、京東、滴滴、美團等“夢中情廠”，工資月薪十分亮眼，都在1萬到2萬元之間，且發(fā)布時間很短，都在1周到1個月之間。

除了新以外，崗位招聘顯然非常急迫。據(jù)招聘軟件顯示，HR們都異?；钴S，一天24小時幾乎全程在線，日均回復次數(shù)在十次以上，隔幾分鐘就回復一次。

“最近只要一上線，有關AI數(shù)據(jù)標注員的招聘消息就瘋狂彈，重復地彈。”不少正在求職的人向【自象限】反映，“上次這么瘋狂的打招呼，感覺還是主播招聘?！?/p>

▲圖源Boss直聘截圖

招聘的火熱，很難不讓人想到大廠的大模型之戰(zhàn)。

不過，據(jù)「自象限」觀察，“AI數(shù)據(jù)標注員”招聘不是由這些大廠直接操辦，而是通過獵頭公司來負責招聘。崗位的名字也是五花八門，有“數(shù)據(jù)標注”、“AI話術編輯”、“數(shù)據(jù)標注分析師”、“標注員”、“AI訓練師”等等。

雖然叫法不同，但關于這些崗位的職能描述卻大差不差，據(jù)招聘軟件信息顯示，其中很大一部分崗位跟現(xiàn)下大熱的大模型有關，入職的數(shù)據(jù)標注員們的日常工作包含，大模型的編輯校對、大模型的數(shù)據(jù)標注管理、大模型的內容質量評估等。

▲圖源Boss直聘截圖

「自象限」向多位招聘HR進行了咨詢，“工作的主要內容是對文心一言大模型回答結果的分析和判斷，工作的地點在百度科技園?！庇蝎C頭回復道。

高薪資待遇、掛鉤大模型、大廠哄搶……有求職者看到了機會，“大模型的風，要帶動新一批大廠人扎根了，普通人的機會來了嗎？”

但事實上，時間緊、任務重的崗位招聘，要求卻并不算低，基本學歷要求本科起步，985、211優(yōu)先本科和碩士優(yōu)先，在具備語言學、中文信息處理、計算語言學、文學等相關專業(yè)背景的同時，還得對一些AI技術的原理有了解。

花椒科技告訴我們，面試的基本流程是，“簡歷初篩-發(fā)筆試題-筆試題通過一輪面試-直接發(fā)offer-培訓”，在學歷方面，獵頭強調“必須得是一本才行，211/985優(yōu)先”。

嚴格準入門檻，招聘軟件上神秘的“AI數(shù)據(jù)標注員”背后，藏著大廠的大模型棋局。

一、我，給大模型當“考官”，月薪兩萬

歷時一個多月的面試，中文系畢業(yè)的羅文（化名）最終敲定了自己的offer——百度文心一言的AI數(shù)據(jù)標注員。連她自己都不敢相信，一個純技術小白現(xiàn)在的日常竟然是給大模型當“考官”。

“畢業(yè)三年，沒有任何AI經驗，轉行漲薪，幅度近50%，月薪在9k-15k左右”，羅文告訴我們。

坐在兩臺電腦前，羅文每天的主要工作有兩項：一是做題，直接給大模型進行“填鴨式”教育；二是給文心一言當“判官”，評判給出的答案對不對、好不好。

所謂“填鴨”就是強行把寫好的答案喂給大模型，這樣的好處就是從數(shù)據(jù)源上不會出錯，以此來提升大模型的訓練效果。羅文告訴「自象限」，數(shù)學題、常識題、作文題她都做過，但這還遠遠不夠，“理論上，越專業(yè)越好，比如我擅長文學領域，那就專攻文學題，有的同事專業(yè)是醫(yī)學，那就做醫(yī)學問答題”，羅文道。

羅文的話已經在一些社交平臺得到驗證，有人曾發(fā)布帖稱，“急需招募金融專業(yè)人員，有償給文心一言答題，一天30多道，每道題價格在1.5-2.4元?！?/p>

▲圖源社交媒體平臺小紅書截圖

另一項工作就是給大模型當“判卷老師”，就像學生考試一樣，每天大模型會生成各種問題的答案，羅文就需要承擔老師的角色，判斷其生成的答案與題目是否一致，答案是否正確。

若遇到諸如作文一類沒有標準化答案且開放性的問題時，則需要評判答案的好壞，比如，系統(tǒng)會隨機給一組數(shù)據(jù)，包含1個問題和3個回答。羅文需要先標注出這個問題屬于什么類型，隨后給3個回答分別打分并排序。分數(shù)區(qū)間為0-5分，如果打分低于3分，還要標注出具體原因，例如“答非所問（0分）”、“嚴重跑題（1分）”、“存在邏輯問題，存在事實性錯誤，比例較小給2分”等。

這個工作雖然看上去并不難，但卻異常重要，甚至可以從外包直通大廠的機會。據(jù)上述獵頭告訴我們，“雖然合同跟我們獵頭公司簽，但是還是有六分之一的幾率轉正，進入百度集團”。這或許也是嚴格控制學歷的原因。

▲圖源Boss直聘截圖

為此，「自象限」也了解到，由于百度地圖的數(shù)據(jù)標注，有穩(wěn)定的地圖業(yè)務需求及自動駕駛模型、算法模型的訓練需求，所以對數(shù)據(jù)標注的質量要求更高，的確搭建了專門的數(shù)據(jù)標注團隊。

市場上對“羅文”的需求，不止大模型公司。據(jù)「自象限」統(tǒng)計，目前，市面上的數(shù)據(jù)標注崗位大致分為兩種。

一種以NLP（自然語言）為主要方向，百度、字節(jié)、京東、美團等一批大模型科技公司一擁而上，給自家大模型找人工數(shù)據(jù)訓練師。這其中又分為幾個細分的方向，譬如數(shù)據(jù)分析、大模型生成結果判定、輔助大模型邏輯推理等等。

另一個方向則是CV（圖像），存在已久，人們更加耳熟能詳?shù)氖恰?D拉框”和“3D拉框”，主要是滿足滴滴、毫末、輕舟智航等這類車企，為其智能駕駛業(yè)務提供圖像數(shù)據(jù)質檢和標注幫助。

▲圖源Boss直聘截圖

「自象限」觀察發(fā)現(xiàn)，十一月是NLP方向數(shù)據(jù)標注的轉折點，此前，百度、京東等大廠無論是校招還是社招，都僅開設了很少或壓根沒有AI數(shù)據(jù)標注崗位，招聘軟件上也只是零星地開放了實習生的崗位，通常不設學歷上限，大專學歷封頂。

毫無征兆地突然冒出一批崗位需求，這背后或許與大模型廠商的研發(fā)受阻有關。多位行業(yè)人士曾向「自象限」透露，截至目前，國內的大模型水平或許僅能達到GPT-3.5水平，發(fā)展的核心還是數(shù)據(jù)質量問題。

一邊是國外OpenAI連放猛招，直逼GPT-5，一邊是國內企業(yè)喊著“要落地”、“要用上大模型”，雙重壓力下，又用起了“人海戰(zhàn)術”。

技術研發(fā)水平不夠，人工能力來補齊，國內大模型廠商開始瘋卷“AI數(shù)據(jù)標注員”，為大模型能力“飛升”再加一把燃料。

二、大廠卷精標，粗標“割韭菜”

事實上，數(shù)據(jù)標注并不是新鮮事兒，早已有之。以前的形式是粗標，主要表現(xiàn)為“拉框”，但現(xiàn)在粗標發(fā)展得亂了套：一是此前大廠粗標多為眾包標注平臺，工單分散，人員不專業(yè)，導致標注質量不行；二是隨著大模型的精進，粗標變得越來越不夠用，精標的地位由此直線上升。

針對粗標和精標的差異，某大廠員工解釋道：“一般廠商的外包團隊，能做標注，但他們就是按照框定的規(guī)則標注，如果出現(xiàn)規(guī)則之外的數(shù)據(jù)，標注就會存在通過率不高的情況來回反復，但是由工程師團隊來做，特別是針對自動駕駛輔助駕駛等回傳的數(shù)據(jù)，他們知道背后的原理，可能不會按照常規(guī)的思路標注，會帶解決問題的思路來標注，可能需要跳出之前制定的標注規(guī)則，這樣標注數(shù)據(jù)的質量會更高?！?/p>

大模型爆火，也為粗標刮起了一陣“新錢風”。

目前，粗標求職陣地已經從招聘軟件轉移到了快手等短視頻平臺。以快手為例，粗標求職熱度與快遞員并列，大量數(shù)據(jù)標注公司入駐快手，覆蓋京津冀、長三角和珠三角地區(qū)。

▲圖源快手截圖

據(jù)「自象限」了解，快手的直播招聘業(yè)務“快聘”曾在發(fā)布會中特別提到：“要解決數(shù)據(jù)標注職類線下招聘難，應聘者少的核心訴求問題 ?！?/p>

落實到實處，快手從公司資質審核、流量扶持、公司推薦到數(shù)據(jù)標注職業(yè)推廣都給予了支持，「自象限」注意到在快手官方招聘直播間中，有時也在全天無間斷地滾動地播報有關數(shù)據(jù)標注求職信息。

這一定程度上也成為了某些數(shù)據(jù)標注公司的“尚方寶劍”。在招聘時候，宣傳之詞毫無遮攔，“無需學歷，上手即會，小學生都能做”，“拉一個框，打一個標簽，就是半個毛”，“拉3000個150元，6000個300元，月入7000-8000灑灑水，只要手速夠快”，極盡夸張之詞。

但事實究竟如何呢？一萬塊錢能拿得如此輕松嗎？

為探究真假，「自象限」在快手報名聯(lián)系上了一家熱門數(shù)據(jù)標注公司。該公司聲稱與比亞迪、理想、小鵬、特斯拉等車企直接簽單獲得一手數(shù)據(jù)任務，且出示了大量的證書、憑證強調其正規(guī)性。入職后的主要任務就是接任務包，在圖片上拉框、標注和打標簽。

▲圖源微信截圖

總結下來，有幾個基本點：打框按計件算錢，一個框價格在一毛到一毛五；薪資首月按周結，第二個月以后按月結算；新手小白需要先繳納2580元培訓費用，一年內工資累計達到1萬，才能退還；平均七天左右學習培訓時間就能上手做任務；分兼職和全職，兼職按框計算，全職線下坐班，另免費提供住宿；在其展示的員工工資截圖中，月工資在5000-6000元不等。

但在黑貓投訴平臺上，上述公司成為了數(shù)據(jù)標注投訴的重災區(qū)。

一些投訴用戶的經歷與我們相吻合。綜合用戶的反饋，投訴主要集中在以下幾個問題：第一，不會拉框需要先繳納2580元費用，一年做拉框任務滿一萬元，但是出現(xiàn)了拒不退款的問題；第二，培訓內容非常簡單，且耗時長，耽誤用戶上崗；第三，不給通過和達標，總是卡拉框的合格率，最終影響收入；第四，態(tài)度豪橫，無視用戶的訴求，不處理、不退款。