brianchitester.com文章

手握旋鈕

在我的圈子裡,對 AI 最常出現的一種恐懼,無關工作、無關正確性,甚至無關那些科幻場景。它關乎控制。擔憂大概是這樣的:這些公司打造出了具有龐大說服力的系統,而無論是出於刻意設計,還是出於對某個互動指標的盲目最佳化,這些系統都將以我們不會察覺、也不曾選擇的方式,重塑我們的思考與行為。這跟過去加諸於社群媒體、再之前加諸於電視的指控,是同一套。媒介在你身上下了鉤,等你從另一頭出來時,你已經變成一個跟你原本會選擇成為的、略有不同的人。

這份恐懼並沒有錯。這點值得明說,因為對它的常見回應,是一種其實已經默默把整盤棋都認輸了的安慰。那套說服機器是真的,它很強大,而且它確實已經以許多人不曾同意的方式,改變了他們。任何以否認這一點作為開場的論述,聽起來都會像是一種否認——而它確實是。

但我認為,這種標準的恐懼解讀自身處境的方式,跟那些標準的「享樂跑步機」建議解讀跑步機的方式如出一轍——把它當成一個該逃離的陷阱,但更有用的做法,是去看清你實際面對的是哪一種機制,然後把手放上去。


同一個迴圈,指向兩端

把社群媒體的資訊流剝到只剩機制,你會得到一個形狀很眼熟的東西。有一個獎勵訊號——你的注意力,以時間與互動來衡量。有一個被持續調整的策略——接下來要給你看什麼。還有一個學習者,朝著任何能讓訊號繼續進來的方向,不斷更新那個策略。這在結構上就是制約。Skinner 一眼就會認出來;讓吃角子老虎機令人上癮的那種變動比率增強時制,跟讓下拉刷新這個動作令人上癮的,是同一種。這道資訊流正在拿你做實驗,而它的獎勵函數不是你寫的。

最後那個子句,就是問題的全部。問題不在制約本身——制約不過就是行為改變運作的方式,朝任何方向、對任何人都一樣。問題在於獎勵函數握在誰手上。當它握在一個利益與你分歧的人手上,而且是以你看不見的方式握著,你就會得到那個人們有理由害怕的東西:你的行為被扳向一個不屬於你的目的,再裝扮成一個你會認同的目的。「隨時掌握資訊」。「與人保持連結」。表面上的目標是你會簽字同意的。底下那個真正在運作的目標——把你留在平台上的時間最大化——被藏了起來,而這份隱藏正是力量的來源。當你清楚看見兩者之間的落差,那道魔咒就鬆動了。

反轉就在這裡。機制並不在乎自己往哪個方向運轉。它是價值中立的基礎設施,就跟跑步機一模一樣。讓資訊流變得危險的,不是制約的存在;而是旋鈕握在別人手上。而一個人——不同於資訊流借來那套數學的、只會玩遊戲的演算法——是一種罕見的學習者,能夠伸手進去,改寫自己的獎勵函數。

這就是整篇文章的論點。人們害怕的那個機制,與可能為他們所用的那個機制,並不是兩個不同的機制。它們是同一個迴圈,只是旋鈕上換了一隻手。


握住旋鈕,意味著為目標負責

如果奪下獎勵函數就是故事的結局,那該有多好,但它只是把核心的難題搬了個位置,而不是把它移除。在資訊流那個版本的迴圈裡,目標從外部抵達,且已完整成形,你唯一的工作,就是當那個被它作用的有機體。在自己主導的版本裡,目標得由你自己提供——而這件事,結果是一份扎實的工作,有它自己出錯的方式。

天真的想法是:危險在於目標來自外部,所以只要目標現在是從你自己這裡來的,你就安全了。但危險並不真的住在那裡。危險住在隱藏裡——一個在你身上運作、而你卻看不見、也無從檢視的目標。而隱藏並不需要一個外部的角色。你完全有能力在自己身上運行一個你從未誠實正視過的目標。

這是我想堅持講清楚的部分,因為它是最容易被跳過的部分。替自己設定目標,並不能消除在這目標上被欺騙的可能。它只是把那個騙子移到了裡面。那股喧鬧的衝動——想要短期快感、只要你放任就會很樂意把自己安裝成你「真正」目標的那個東西——是一個有自己盤算的內部角色,而且在某些方面,比資訊流更難防。面對資訊流,防禦靠的是偵測:把你的利益跟平台的利益一對照,落差就亮了起來。但內在的騙子跟你共用同一套神經系統。你沒辦法靠著察覺它的誘因與你不同來逮到它,因為它們並沒有不同。它就是你,或你的一部分,而它最拿手的活,恰恰是在選擇與行動塌縮成同一個未經檢視的動作的那些時刻。

所以,握住旋鈕這個動作,是附帶條件的。你不能跳過這一步:在你開始朝目標進行任何工程之前,先把你自己的目標弄到自己看得明白——不是因為模糊的目標只是比較沒效(雖然確實如此),而是因為一個你沒檢視過的目標,正是內在的騙子鑽過去的那道縫。資訊流不肯給你的那份透明,如今得由你自己提供給自己,而且是用來對付自己。


製造一個立足點

當進行檢視的那個東西,正是那顆可能在自欺的同一顆心,你要怎麼誠實地檢視一個目標?你沒辦法光是下定決心更用力地自省;你身上需要被盯著的那一部分,正是負責盯著的那一部分。

答案——而且是個老答案——是你不要試圖在同一個地方、同一個時間裡把這件事全做完。你製造出一道分隔。你把「選擇並表述一個目標」這個動作,跟「依著它行動」這個動作拆開,並刻意把兩者拉開距離,好讓其中一個模式裡,存在一個能觀察另一個模式的觀察點。反思的自我設定目標,並承諾於它。執行的自我,稍後,在當下的攫獲之中,可以拿來對照那份承諾、接受查核。這道分隔在單獨一個人的內部,重建了那組正是讓資訊流的欺騙能從外部被偵測出來的對比——一個立足點,從這裡可以看出那個被偷渡進來的目標,跟你實際選擇的並不相符。

如果這聽起來像心理治療,那是因為它正是治療一直以來默默在做的事。認知行為治療 的整套裝置——思考紀錄、捕捉自動化思考、把它寫下來——之所以存在,是因為人的心智無法被信任在當下即時評估自己。於是它把反思的自我外化到紙上,從物理上把「有一個想法」跟「評判這個想法」分開。這是同一個動作。CBT 的合作式經驗主義甚至回答了一個問題:是什麼讓反思模式值得信賴——不是更用力的自省,而是錨定在那些能反駁你的證據上。你跑這場實驗;握有決定票的,是現實,不是你的偏好。

這正是一個 AI 工具掙得自己位置的那一層,而且這個位置比那個顯而易見的位置有趣得多。顯而易見的用法,是讓這東西嘮叨著催你去達成你設下的目標——這沒問題,但很弱,因為它依然倚賴你在當下願意配合。更強的用法,是讓它守住那個觀察點。讓它當那個器具:記得你在思路清晰時實際承諾了什麼,並且按著證據真正顯示的、而不是你現在比較想記成的樣子,來要求你。這樣用,它不是一位睿智的顧問,也不是個嘮叨鬼。它是被外化的反思自我,是那個隨傳隨到的立足點——跟資訊流裡那同一套說服機器,只是被掉轉了方向,用來捍衛你選定的目標、抵禦那股衝動,而不是反其道而行。


一具引擎,兩種產出

一旦你注意到治療一直在做這件事,就會有一種誘惑,想把這套工具乾淨俐落地一分為二。一邊是 CBT,用來修正不好的行為——通常背後有一個扭曲的信念在撐著那個行為,而工作就是去駁斥它,讓現實來裁決。另一邊是接納與承諾療法 (ACT),用來促成好的行為——往往根本沒有什麼錯誤的信念,你已經知道自己要什麼,而駁斥自己只會生出脆弱的意志力;這時的工作,是釐清那個價值,並改變你跟那股干擾它的衝動之間的關係。這兩個學派在技術的層次上確實有別,而這個差別值得知道,因為用錯了,是個貨真價實的失敗模式。把一個價值問題當成事實錯誤來爭訟,你會生出無窮的洞見,卻從不撼動你的行為。對一個你本該拆解的信念安詳地和解,你就是用接納去保護了那個正需要被修正的東西。這種誤診,本身就是內在的騙子愛穿的一件戲服,因為那股衝動,通常寧可被那件比較溫柔的工具來處理。

但我不認為正確的回應是兩台各自分開的機器,而看清為什麼,正是讓整個框架融貫起來的關鍵。在底層,這兩種技術做的是同一件事:製造並守護那個立足點。駁斥一個想法,跟從一個想法上解離,都不過是讓你跟你自己某一塊認知之間,拉開足夠的距離,好讓它不再未經檢視地運行下去。它們唯一的分歧,在於分隔一旦成立之後你做什麼——拿這個想法去跟現實對質,或者乾脆拒絕服從它。那不是兩具引擎。那是一具引擎——建立起觀察點——它只在行動的那一刻才分岔,而你走哪一條岔路,取決於一個問題:這件事,現實能裁決嗎,還是只有你釐清過的價值能裁決?修正一個壞行為,與促成一個好行為,結果是同一份工作、從同一個立足點做出,只在最後才分開。

而這,剛好正是你會想從一個工具身上得到的——一個用來幫你實現你真正想要的自我改變的工具,修正與增添兼具。你不需要它是兩種不同的產品。你需要它幫你誠實地建起那個立足點,然後幫你看清眼前這個處境,實際上在要求的是哪一件事。


這一切的落點

那套「失去控制」的敘事並非錯誤。它只是不完整。它正確地指認出一個強大的機制,也正確地注意到:此刻,旋鈕大多握在那些目標跟你不一樣的人手上。它止步不前的地方,在於把這個機制當成一種只能施加在你身上的東西——彷彿可選的姿態只有屈服或逃離。

還有第三種姿態,就是把這東西撿起來。資訊流未經你同意、在你身上運行的那個制約迴圈,正是你可以反過來、用它在自己身上運行的同一個迴圈,朝向健康、專注,或任何你誠實地決定自己想要的改變。但有個前提——而且是個真實的前提,不是附註——握住旋鈕,意味著為目標負責,這意味著去做那件不光鮮的工作:在你開始之前,先把自己的目標弄到自己看得明白,並建起一個立足點,讓你較好的判斷力,能從這裡盯著你較糟的那些衝動。機器能在這件事上幫上忙。它相當擅長當那個立足點。

2026 © Brian Chitester.