Joy & Curiosity #72

來自:Thorsten Ball
日期:2026-02-03

在 https://registerspill.thorstenball.com/p/joy-and-curiosity-72 查看這篇文章的網頁版本

這種脫節從何而來?為什麼有些程式設計師幾乎忍不住要抱著頭尖叫「天啊,一切都在改變」,而其他人卻只是輕描淡寫地說這些模型不會寫程式碼?

到了這個時候,我只能猜測。因為現在我要說,如果他們還沒看到軟體的結構將如何改變,那就是他們的問題了。這是一扇單向門:人們走過去,經歷他們的「天啊」時刻,然後就不會回頭了。那麼為什麼還沒有更多人跨過這扇門?

是因為他們根本沒有充分使用這些模型,沒有向它們拋出足夠多不同大小和類型的問題,在不同的環境中?他們是否仍然認為從 ChatGPT 複製貼上等同於使用可以利用反饋循環的代理(事實並非如此)?

或者他們沒有使用最好的模型,前沿模型,也沒有在它們身上花足夠的錢?他們是否錯誤地認為他們可以在自己的硬體上運行的本地模型能讓他們了解我們所處的軌跡?

或者,也有可能,他們只是不擅長提示?他們真的認為「修復它」是一個好的提示嗎?我見過這樣的提示,是的,當然你會對從中得到的東西不滿意。

或者他們還不知道告訴代理(不是 ChatGPT,不是缸中之腦)如何運行命令,在 AGENTS.md 文件或類似文件中,會產生多大的差異?

他們是否按照他們(人類)如何編寫來判斷代理產生的程式碼?他們這樣做是因為他們沒有使用 LLM 來理解或解析程式碼或稍後更改它?他們是否沒有思考過我們在過去二十、三十年中學到、讀到和教授的一切,關於「好吧,程式碼不僅被機器讀取,它也被人類讀取,這就是為什麼它需要是乾淨的、好的、格式化的,需要溝通」——這是否現在有點過時了,因為你現在可以要求模型用任何你想要的語言向你解釋給定的程式碼,帶著笑話和雙關語,作為詩歌或歌曲?

也許他們還沒有把手從方向盤上拿開足夠長的時間,看看這趟旅程會在哪裡結束?是的,氛圍編碼是絕對極端的,但試著拿一個簡單的文件,讓代理為它編寫測試,讓代理運行它們,不要看程式碼,讓代理修改程式碼並運行測試,增加範圍,看看這會帶你去哪裡。

或者他們緊抓著確定性的舊世界?他們不喜歡有 3% 的機會代理不會完全按照我想要的方式做事?

我不知道。但如果你還沒有嘗試過上述所有內容,我強烈建議你這樣做。是時候親眼看看,睜大眼睛,這些模型能做什麼和不能做什麼,如果你不在所有方向上足夠努力地推動它們,你就不會得到很好的了解。

我們在 Amp 中推出了一個新的代理模式:deep。它在引擎下使用 GPT-5.2-Codex,天啊,那個模型是一個非常有趣的野獸。它一直在走,一直在走,一直在走,你以為它永遠不會停止,但然後你能聽到 Amp 的叮咚聲,天啊,它做到了。但另一方面:它也很懶?它不太想運行命令,也不像 Opus 那樣反應敏捷,所以體驗和你應該與它互動的方式非常不同(這就是為什麼它是一個單獨的模式)。我對此非常興奮。(如此之多,以至於我可能會失去我內部的「Gemini 3 愛好者」綽號,並得到一個新的。)

我錄製了另一個短視頻,這次是在雪中,談論你需要一直理解你的代理編寫的所有程式碼的想法。從反應來看,一些觀眾沒有看完整個視頻,或者他們從未與另一個人在同一個項目上工作過。

Peter Steinberger 描述了當他自己的代理通過回答語音訊息讓他大開眼界的時刻,這是他從未計劃代理能夠「做到」的事情。精彩的片段。如果我可以給你一個週末的建議:建立一個代理,給它一個名為 bash 的單一工具,讓它執行 Bash 命令,然後在沙盒中啟動它並向它拋出問題。看看它能走多遠。要求它製作播客的文字稿,要求它使用 Grafana 和 Prometheus 設置儀表板,要求它編寫一些程式碼,要求它修改自己,要求它……嗯,真的任何東西!目標是向它拋出越來越難的問題,看看它只用 bash 能走多遠。

Peter 的代理當然是 Clawdbot。我應該說,前稱。他不得不重新命名 Clawdbot,因為 Anthropic 不喜歡它,現在它被稱為 OpenClaw。但那是在代理以 Moltbot 的名字經過短暫時期之後,這也是為什麼——在這裡糾正姿勢,清喉嚨,喝口水——「AI 代理的社交網絡」被稱為 moltbook。沒錯。是的。當我第一次點擊那個鏈接時,我輕描淡寫地說。那很可愛,我想,但當然編碼代理可以創建一個網站並相互交談。但後來,在閱讀了 Simon Willison 對此的評論(「Moltbook 現在是互聯網上最有趣的地方」)後,我開始想:這就是很多科幻故事的開始方式,不是嗎?哈哈,如果……會不會很有趣,然後哈哈變成了哦,甚至可能是呃-哦。我不擔心,但很好奇,因為你再也聽不到太多關於隨機鸚鵡的事情了,對吧?現在,記住這個想法,然後——

——閱讀並觀看這個。一方面:是的,當然,一個可以訪問 bash 和瀏覽器並且沒有以任何其他方式受到限制的代理絕對可以去 Twilio 並為自己設置一個電話號碼並打電話給你;是的,當你可以編程時,你就可以做到:你可以將文本發送到文本轉語音模型,你可以使用 ffmpeg 獲取音頻並轉換它,你可以將它發送到 Twilio 並打電話給某人並播放該音頻文件。另一方面:呃。

你再也聽不到太多關於橡皮鴨的事情了,對吧?「軟體工程中的一種調試技術,程式設計師用自然語言一步一步地解釋他們的程式碼——無論是大聲說出還是書寫——以揭示錯誤和誤解。」在不久的將來,時間旅行者五年前說,我們都會一直在進行橡皮鴨調試,但不會有任何橡皮鴨,因為我們將與機器中的幽靈交談。

Olaf 寫下了他如何使用 jj 工作區來並行運行多個代理:使用 jj 工作區操作本地自主 GitHub。我目前在四個不同的 Ghostty 標籤中使用四個檢出,這非常簡單,但並不完全是自豪感的來源,現在我對 jj 工作區非常感興趣。

Nolan Lawson 談論他如何改變了對 AI、LLM 以及它們對編程的影響的看法:AI 部落主義。「坦率地說,我不想最終進入這個未來,我也絕不是在舊世界的墳墓上跳舞。但我看到很多同行開發者把頭埋在沙子裡,拒絕承認他們眼前的真相,這讓我心碎,因為我們很多人都害怕、困惑或不確定,而我們中沒有足夠的人誠實地談論這件事。[…] 對我來說,真相是這樣的:在向你出售現成解決方案的騙子、哭泣軟體開發末日的末日預言者和堅持整個紙牌屋即將崩潰的堅守者之間——沒有人知道任何事情。這是最難承認的真相,也許這就是為什麼我們中的許多人害怕或抨擊。」多麼好的文章。

Tailscale 的 Aperture。這太迷人了。在看了這些截圖後,我不禁想:呃,是的,也許人工智能會變成像電一樣的東西;從某物中出來並進入某物的東西。

然後我看到了 Mistral 的 CEO Arthur Mensch 的這段片段:「如果你假設整個經濟將在 AI 系統上運行,企業只會想確保沒有人可以關閉他們的系統。[…] 如果你把智能當作電,那麼你只想確保你對智能的訪問不能被限制。」

可愛:彈跳球總會彈回來。我從未嘗試過 KDE 的彈跳球,也沒有太多使用 KDE,但我絕對感到與其他姓 Ball 的人有某種親屬關係,這篇文章很棒。然後是最後一段:「雖然彈跳球經常讓我們發笑,但我認為它和類似的創作背後有一個更大、更沉重的故事。我,像許多用戶一樣,很少,如果有的話,想到我使用過的軟體的底層技術。但我們都記得搖擺的窗戶、彈跳的球、有個性的 Clippy 和 Kandalf、瘋狂的 Winamp 皮膚、標誌性的壁紙、迷人的 UI 聲音或與我們產生共鳴的用戶圖片。就好像他們都在說:『嘿,我不只是一個功利主義的東西來完成你的工作,我想與你聯繫』。」

「幫助我的建議:尋找真實的東西。」完美搭配:稀有類型的建議,實際上很有用(因為它簡短、令人難忘和普遍),以及清晰簡潔的寫作。

這非常好,因為它沒有你可能期望在帶有此標題的帖子中找到的所有陳詞濫調:我作為工程經理 10 年學到的東西。當然,許多提到的要點取決於它們的實施方式。我曾經有一位經理將第 7 點「你的目標是讓你的團隊在沒有你的情況下茁壯成長」理解為,嗯,當他去度假時沒有人應該注意到。而且沒有人注意到。

Amp 團隊是這裡的 A 團隊。

zerobrew,一個「直接替換、5-20 倍更快的實驗性 Homebrew 替代方案。」天啊,拜託。

Kailash Nadh,帶著一些非常有經驗的、第一原則思考:代碼很便宜。給我看對話。我很喜歡這個。「然後,那些譴責者,他們似乎無法超越來自不可置信的論證。他們譴責 LLM 是因為他們個人不喜歡它們,無論出於什麼原因,或者無法獲得理想的結果,或者對它們有錯誤的期望,或者只是厭倦了它們。但這是無關緊要的,因為有相當多的人正在富有成效地使用完全相同的工具,並且有相反的經驗。我就是其中之一。」正如你可能猜到的,我同意他在這裡寫的很多東西。一切都在改變,如果你仍然看不到這一點,我認為這是你的眼睛有問題。

同一件事的另一個角度:代碼現在很便宜。軟體不是。也非常好。「這種轉變有一個有用的框架:AI 實際上已經消除了工程槓桿作為主要差異化因素。當任何開發者都可以使用 LLM 以過去所需時間的一小部分構建和部署複雜功能時,編寫代碼的能力不再是曾經的競爭優勢。僅僅成為『建造者』已經不夠了。相反,成功現在取決於更難自動化的因素。品味、時機和對受眾的深刻、直覺的理解比以往任何時候都更重要。你可以在一個週末生成一個產品,但如果你構建了錯誤的東西或將其推出給一屋子不聽的人,那就毫無價值。」

「眾所周知,很容易陷入無意識的假設,認為任何這樣的活力都是為了以後:在你整理好你的生活之後;在目前繁忙的階段過去之後;在頭條新聞不再如此令人震驚之後。但對於有限的人類來說,真相是,就在這裡,就是真實的生活。如果你要做對你重要的事情——並在做這件事時感到享受或活力——你將不得不在你掌握一切之前做,在你解決了拖延問題或親密問題之前,在你確信民主或氣候的未來已經得到保證之前。生活的這一部分不僅僅是你必須經歷的事情,以到達真正重要的部分。這是真正重要的部分。」

一個提醒,一個吟唱,也許甚至是一個祈禱,永遠不會浪費:做事就是做事。

這非常非常有趣:「我構建了一個快 2 倍的詞法分析器,然後發現 I/O 才是真正的瓶頸。」幾年前,當我試圖弄清楚為什麼進程在我的 Linux 機器上啟動得比在我的 MacBook 上更快時,我有過類似的經歷,但在某個時候決定我已經找到了我的答案:Linux 更快,而且我的 MacBook 上有設備管理的東西。但後來我閱讀了那篇博客文章的附錄,哇,多麼深的兔子洞!那個附錄是一個金礦,最好的評論部分。

它來了!它來了!Dithering 的第 2 部分!天啊,這太好了!投入的工作量是一回事,但要想出所有這些可視化來解釋同一主題的不同方面?令人印象深刻。

antirez:「自動編程是生產軟體的過程,試圖成為高質量的並嚴格遵循生產者對軟體的願景(這個願景是多層次的:可以從如何做,確切地說,某些事情,在更高層次上,到介入並告訴 AI 如何編寫某個函數),在 AI 協助下。當然,過程的基本部分是,*做什麼*。」

Fresh,「一個你可以直接使用的終端文本編輯器。」我現在不在尋找新編輯器,但這似乎很有趣。我玩了玩它,不得不對這一切微笑:終端中的一個文本編輯器,從過去 20、30 年的不同編輯器中汲取靈感,然後看起來也完全像那樣,像 30 年的混合。

Steven Soderbergh 的 SEEN, READ 2025。格式很瘋狂,老兄。它聽起來非常不應該這樣,但格式似乎打破了我的大腦。

我不確定是否應該鏈接到它,因為他確實惹惱了很多人,但我確實認為他的許多預測都是正確的,這使得他值得傾聽:Peter Thiel 在 Spectator 接受採訪。此外,反基督者出現了,所以,是的,在好奇心欄中打個標記。

Runway 的 CEO Cristóbal Valenzuela 談論像素經濟:「今天的像素經濟建立在稀缺性之上。昂貴的相機、專業軟體、編輯團隊、渲染農場、分發網絡。每個步驟都需要大量資本和專業知識。這種稀缺性創造了價值,但它也創造了障礙。在這個世界上,創作者是那些掌握系統的人。AI 媒體生成正在完全崩潰這些障礙。創建像素的價值正在趨向於零。當任何人都可以在沒有專業軟體或設備的情況下生成任何視覺效果時,經濟學就會翻轉。」這已經很有趣了,因為我不太了解電影和媒體製作,但是,當然它不僅僅是關於媒體,不是嗎:「我目前的賭注是,大約一半的主要上市軟體公司在未來五年內不會生存,因為這個藍線陷阱。而且我並不孤單這種情緒。我們要去的地方,你不必學習界面。界面將適應你的需求。像素經濟正在從『學習我們的工具』轉向『只需告訴我們你想要什麼』。」

在「是手機還是不是手機?」這個非常長的乒乓球遊戲中的另一次發球:「作者發現,從 8 年級到 9 年級以及從 9 年級到 10 年級,女孩和男孩的社交媒體使用增加對他們第二年的心理健康沒有不利影響。花更多時間玩遊戲對學生的心理健康也沒有負面影響。」

這是流媒體發生的最偉大的事情,很長時間了。

「AI 現在處理優化的東西。比我們以往任何時候都好。它找到模式,最大化輸出,消除浪費。它不能做的是真正愚蠢。真正愚蠢可能是最後的人類超能力。它不能有改變一切的隨機碰撞。AI 提高了基線。隨機性成為優勢。」我開始認為,我們個人獨特經歷的總和將在未來有價值。

如何為你的 CLI 應用程序選擇顏色。更多這樣的帖子!

Anthropic:「在一項隨機對照試驗中,我們檢查了 1)軟體開發者在有和沒有 AI 協助的情況下掌握新技能(在這種情況下,是 Python 庫)的速度;以及 2)使用 AI 是否使他們不太可能理解他們剛剛編寫的代碼。我們發現,使用 AI 協助導致掌握程度在統計上顯著下降。在涵蓋他們幾分鐘前剛使用的概念的測驗上,AI 組的參與者得分比手工編碼的參與者低 17%,或者相當於近兩個字母等級。使用 AI 稍微加快了任務,但這沒有達到統計顯著性的閾值。

重要的是,使用 AI 協助並不能保證較低的分數。有人如何使用 AI 影響了他們保留了多少信息。」我不確定這說明了什麼。你可以在十年前做一項研究來揭示「研究發現使用庫的程式設計師不知道它們是如何工作的。」我發現這是一個有趣的評論。

一個你可以「永遠登錄」的網站:loginwave。這是我最糟糕的噩夢。如果我要讓這個頁面打開五分鐘,我的心率會讓我的手錶叫救護車。

ISOCOASTER。我根本沒有玩過這個,我只是買了一些食品攤位。所以,讓我們在我放在美麗的漢堡攤旁邊的美麗的玉米片攤相遇,坐在陰涼處。

如果你穿過了單向門或對此感到好奇,你應該訂閱:


← 返回列表