Thoughts on the job market in the age of LLMs

來自:https://www.interconnects.ai/p/thoughts-on-the-hiring-market-in
日期:2026-02-03

對於在AI尖端領域工作(或想要進入此領域)的人來說,當今就業市場存在一個普遍且相互的挑戰。在招聘方,常常感覺無法招到、甚至無法引起理想候選人的興趣。在個人方面,常常感覺當前工作的機會成本極高——即使紙面上實際的工作和生活都非常好——這是由於瘋狂的薪酬數字。

對於資深科技工作者來說,AI領域的招聘過程可能感覺像是一層持續的迷霧。對於初級員工來說,可能感覺像是一堵牆。

在我作為混合研究主管、個人貢獻者和導師的角色中,我花了很多時間思考如何找到合適的人一起工作,以及為我的學員找到合適的工作。

這裡的建議是基於當前LLM時代的緊迫性而形成的。這些招聘實踐是針對一個相關性時間線優化的,隨著核心技術的變化,可能需要每1-2年重新審視——這可能對人員、行業或你自己的長期投資不是最好的。我已經單獨寫過關於這種節奏的代價,並不打算無限期地持續下去。

這個時代招聘最顯著的特點是語言模型的複雜性和進步速度。這創造了兩個類別。一方面,資深員工更受青睞,因為他們對如何長期工作和引導複雜系統有更多的背景理解。當你的團隊在AI代理的幫助下可以在增量功能上取得巨大進步時,需要很多遠見才能理解一個庫的正確方向。沒有遠見,儲存庫可能會被太多小改動鎖定。有了強大的AI工具,我預計資深員工的影響力增長速度會比增加初級團隊成員更快。

鑒於我對當前和未來AI代理的經驗和期望,這種對關鍵資深人才重要性的看法是最近才轉變的: 每個工程師都需要學習如何設計系統。每個研究員都需要學習如何運營實驗室。代理將人類推上組織架構圖。

另一方面,初級員工必須以不同的方式證明自己。我在初級工程員工中尋找的首要特質是對取得進步的近乎狂熱的執著,無論是在個人理解還是模型性能方面。學習如何製作香腸的唯一方法就是親自動手,要趕上進度需要在一個狹窄的領域付出大量努力來培養所有權。有了足夠的動力,初級員工可以快速擴展影響力,但沒有這種動力,他們幾乎可以被編碼代理取代(或很快就會如此)。這是非常艱苦的工作,也很難招募。我對找到這些人的最佳建議是「氛圍感」,所以我也在尋找如何找到他們的建議!

舉個例子,當我邀請Florian Brand來幫助Interconnects追蹤開源模型時,我第一次和他聊天時他直接說「自從ChatGPT問世以來,我就完全沉迷於LLM了。」你不需要在這裡重新發明輪子——如果是真誠的,人們會注意到。

對於初級研究員來說,有更多的寬容,但這主要是因為他們首先在教育機構工作,而不是在低調殘酷的科技經濟中。在這裡創造成功的定義性特質是對支持主張的執著。所以一個新想法改進了模型,為什麼?所以我們的評估分數更高了,這在我們的測試框架中看起來是什麼樣子?迭代速度來自於執行這種實踐。太多早期職業研究員試圖在向自己和導師清楚展示深度之前建立影響力的廣度(例如在許多項目中收集貢獻)。最好的研究員則同時帶來結果的清晰度和嘗試新想法的速度。

因此,今天在學術界工作可能對初級人才來說是一個更有培育性的環境,但在財務上伴隨著更大的機會成本。我經常被問到是否應該離開博士學位去找一份實際工作,我的決策標準相當簡單。如果你不打算成為教授,並且有機會在一個前沿實驗室(Gemini、Anthropic、OpenAI是我的名單)做建模研究,那麼幾乎沒有理由留下來完成你的博士學位。

讓人們堅持下去的小原因往往最終是對做困難事情的自豪感,這我尊重。很難將這些相當直接的職業建議與我其他基於人選擇工作的建議協調起來,因為你將與他們共度大量時間,而不是你將要做的工作內容。基於人選擇工作是基於所謂「氛圍感」選擇工作的最佳方式之一。

在產品前沿實驗室工作作為攻讀博士的替代方案,是一條被企業機器吸收而不突出的道路,將自己降低到標準的科技職業階梯。我覺得對我和Ai2其他人如此有效的一部分,是在工作中擁有責任、公開可見性和執行的勝利組合。公開工作對職業發展有一些特別的好處,尤其是在行業如此封閉的情況下,人們常常高估你的技術能力和產出。也許這只是開源貢獻回報給你的善意。

如果你去一個封閉的實驗室,可見性幾乎總是不可能的,所以你依賴責任和執行。如果你在一個沒有人接觸的產品或模型上做著出色的工作,執行得好也沒用。處於核心團隊很重要。

這一切都回到了尋找人才的招聘管道。

市場上有許多不完美的信號,既有正面的也有負面的。對於建立個人作品集的個人來說,避免負面信號至關重要,因為招聘競爭如此激烈。一個小而清晰的負面信號是初級研究員在太多論文中作為中間作者。直接說不,這對你有幫助。

正面信號比較混亂,但仍然可行。有人說你可以通過閱讀一個人的一條推文判斷他是否是天才,我同意這一點。書面文字仍然是一種極其有效且未充分利用的溝通形式。一篇優秀的博客文章可以標誌著真正、罕見的理解。反之亦然,一篇AI垃圾博客文章會毀掉你的申請。

我經常建議那些詢問如何在AI領域建立職業生涯的人的其他途徑是開源代碼貢獻或開放研究小組(例如EluetherAI)。我見過更多在前者(開源代碼)上的成功案例。然而,這仍然非常罕見,因為A)大多數人沒有硬體來為這些流行的LLM儲存庫添加有意義的代碼,B)大多數人堅持的時間不夠長。歷史上,達到做出有意義貢獻的點一直非常困難。

在編碼代理時代,做開源AI貢獻可能會容易一些,因為今天很多限制因素只是在實現長長的待辦功能列表時的帶寬,但在AI垃圾PR和Issue的海洋中脫穎而出將會很困難。這需要品味、創造力、人文精神和耐心。所以,能夠在4000美元的DGX Spark上運行一些小模型是一項投資,但至少在某種程度上可以迭代對像HuggingFace的ML庫這樣的事物做出有意義的代碼貢獻。

回到招聘的整體脈絡,以上重點關注了特質,但拼圖的最後一塊是契合度。第一個要問的問題是「這個人優秀嗎?」第二個問題是「這個人在這裡會茁壯成長嗎?」每個組織都有不同的限制,但尤其是在小團隊中,第二個問題定義了你的文化。在初創公司,如果你增長太快,你肯定會失去對文化的控制。這不是說公司不會有強大或有用的文化,而是說你無法引導它。組織的文化是所有個體互動的副產品。你不想在這裡擲骰子。

就個人而言,我正在Ai2的核心後訓練方法團隊中建立幾個職位。後訓練配方變得非常複雜,我們正在努力使它們更容易運行,同時研究基礎問題,如後訓練數據混合和縮放定律。稍微模糊地說,為Olmo 3和Olmo 2完成後訓練配方對團隊來說...非常艱難。與此同時,後訓練並沒有變得更加開放,所以通過招聘並完成艱苦的工作是唯一的途徑。

理想情況下,我會招聘一名工程師和一名研究員,兩者都相當資深,意味著至少擁有博士學位或類似年限的技術工作經驗。有一些經驗和上述執著精神的初級工程師肯定也可以。

這個呼籲作為招聘的一個好教訓。有意讓人們自我篩選這一點,沒有人喜歡你在為工作推銷自己時過度誇大。我也故意讓人們找到我的電子郵件作為一個練習。冷郵件和在正確管道中接觸人的藝術對於獲得聘用至關重要。許多你在AI領域仰望的人會閱讀他們的郵件,你沒有得到回覆的原因是因為你的郵件格式不正確。最好的冷郵件向收件人展示他們從中學到了東西或明顯受益於收到它。恭維和讚美當然很好接受,但最好的冷郵件能激發行動。

我在Ai2幫助招聘的最近兩個人中,我是通過這些側門工作申請(即不是通過職業頁面申請堆中找到的)了解到的。我通過他的博客和在線聲譽了解了Finbarr。Tyler給我發了一封出色的冷郵件,附有與我明顯當前興趣領域相關的高質量博客文章,並有有意義的開源LLM貢獻。兩者都是優秀的隊友(和朋友),所以我總是樂於說這個系統有效,只是令人畏懼。

總的來說,我對AI就業市場非常矛盾。它顯然對我們行業的初級成員來說是殘酷的,顯然感覺短視,顯然伴隨著大量的機會成本,等等。與此同時,能夠為如此有意義和令人興奮的技術做出貢獻是一種特權。我招聘的基礎仍然是依賴我的直覺和人性,而不是被所有噪音束縛。像大多數事情一樣,這只需要時間和努力。


← 返回列表