手握旋鈕

在我的圈子裡，對 AI 最常出現的一種恐懼，無關工作、無關正確性，甚至無關那些科幻場景。它關乎控制。擔憂大概是這樣的：這些公司打造出了具有龐大說服力的系統，而無論是出於刻意設計，還是出於對某個互動指標的盲目最佳化，這些系統都將以我們不會察覺、也不曾選擇的方式，重塑我們的思考與行為。這跟過去加諸於社群媒體、再之前加諸於電視的指控，是同一套。媒介在你身上下了鉤，等你從另一頭出來時，你已經變成一個跟你原本會選擇成為的、略有不同的人。

這份恐懼並沒有錯。這點值得明說，因為對它的常見回應，是一種其實已經默默把整盤棋都認輸了的安慰。那套說服機器是真的，它很強大，而且它確實已經以許多人不曾同意的方式，改變了他們。任何以否認這一點作為開場的論述，聽起來都會像是一種否認——而它確實是。

但我認為，這種標準的恐懼解讀自身處境的方式，跟那些標準的「享樂跑步機」建議解讀跑步機的方式如出一轍——把它當成一個該逃離的陷阱，但更有用的做法，是去看清你實際面對的是哪一種機制，然後把手放上去。

同一個迴圈，指向兩端

把社群媒體的資訊流剝到只剩機制，你會得到一個形狀很眼熟的東西。有一個獎勵訊號——你的注意力，以時間與互動來衡量。有一個被持續調整的策略——接下來要給你看什麼。還有一個學習者，朝著任何能讓訊號繼續進來的方向，不斷更新那個策略。這在結構上就是制約。Skinner 一眼就會認出來；讓吃角子老虎機令人上癮的那種變動比率增強時制，跟讓下拉刷新這個動作令人上癮的，是同一種。這道資訊流正在拿你做實驗，而它的獎勵函數不是你寫的。

最後那個子句，就是問題的全部。問題不在制約本身——制約不過就是行為改變運作的方式，朝任何方向、對任何人都一樣。問題在於獎勵函數握在誰手上。當它握在一個利益與你分歧的人手上，而且是以你看不見的方式握著，你就會得到那個人們有理由害怕的東西：你的行為被扳向一個不屬於你的目的，再裝扮成一個你會認同的目的。「隨時掌握資訊」。「與人保持連結」。表面上的目標是你會簽字同意的。底下那個真正在運作的目標——把你留在平台上的時間最大化——被藏了起來，而這份隱藏正是力量的來源。當你清楚看見兩者之間的落差，那道魔咒就鬆動了。

反轉就在這裡。機制並不在乎自己往哪個方向運轉。它是價值中立的基礎設施，就跟跑步機一模一樣。讓資訊流變得危險的，不是制約的存在；而是旋鈕握在別人手上。而一個人——不同於資訊流借來那套數學的、只會玩遊戲的演算法——是一種罕見的學習者，能夠伸手進去，改寫自己的獎勵函數。

這就是整篇文章的論點。人們害怕的那個機制，與可能為他們所用的那個機制，並不是兩個不同的機制。它們是同一個迴圈，只是旋鈕上換了一隻手。

握住旋鈕，意味著為目標負責

如果奪下獎勵函數就是故事的結局，那該有多好，但它只是把核心的難題搬了個位置，而不是把它移除。在資訊流那個版本的迴圈裡，目標從外部抵達，且已完整成形，你唯一的工作，就是當那個被它作用的有機體。在自己主導的版本裡，目標得由你自己提供——而這件事，結果是一份扎實的工作，有它自己出錯的方式。

天真的想法是：危險在於目標來自外部，所以只要目標現在是從你自己這裡來的，你就安全了。但危險並不真的住在那裡。危險住在隱藏裡——一個在你身上運作、而你卻看不見、也無從檢視的目標。而隱藏並不需要一個外部的角色。你完全有能力在自己身上運行一個你從未誠實正視過的目標。

這是我想堅持講清楚的部分，因為它是最容易被跳過的部分。替自己設定目標，並不能消除在這目標上被欺騙的可能。它只是把那個騙子移到了裡面。那股喧鬧的衝動——想要短期快感、只要你放任就會很樂意把自己安裝成你「真正」目標的那個東西——是一個有自己盤算的內部角色，而且在某些方面，比資訊流更難防。面對資訊流，防禦靠的是偵測：把你的利益跟平台的利益一對照，落差就亮了起來。但內在的騙子跟你共用同一套神經系統。你沒辦法靠著察覺它的誘因與你不同來逮到它，因為它們並沒有不同。它就是你，或你的一部分，而它最拿手的活，恰恰是在選擇與行動塌縮成同一個未經檢視的動作的那些時刻。

所以，握住旋鈕這個動作，是附帶條件的。你不能跳過這一步：在你開始朝目標進行任何工程之前，先把你自己的目標弄到自己看得明白——不是因為模糊的目標只是比較沒效（雖然確實如此），而是因為一個你沒檢視過的目標，正是內在的騙子鑽過去的那道縫。資訊流不肯給你的那份透明，如今得由你自己提供給自己，而且是用來對付自己。

製造一個立足點

當進行檢視的那個東西，正是那顆可能在自欺的同一顆心，你要怎麼誠實地檢視一個目標？你沒辦法光是下定決心更用力地自省；你身上需要被盯著的那一部分，正是負責盯著的那一部分。

答案——而且是個老答案——是你不要試圖在同一個地方、同一個時間裡把這件事全做完。你製造出一道分隔。你把「選擇並表述一個目標」這個動作，跟「依著它行動」這個動作拆開，並刻意把兩者拉開距離，好讓其中一個模式裡，存在一個能觀察另一個模式的觀察點。反思的自我設定目標，並承諾於它。執行的自我，稍後，在當下的攫獲之中，可以拿來對照那份承諾、接受查核。這道分隔在單獨一個人的內部，重建了那組正是讓資訊流的欺騙能從外部被偵測出來的對比——一個立足點，從這裡可以看出那個被偷渡進來的目標，跟你實際選擇的並不相符。

如果這聽起來像心理治療，那是因為它正是治療一直以來默默在做的事。認知行為治療的整套裝置——思考紀錄、捕捉自動化思考、把它寫下來——之所以存在，是因為人的心智無法被信任在當下即時評估自己。於是它把反思的自我外化到紙上，從物理上把「有一個想法」跟「評判這個想法」分開。這是同一個動作。CBT 的合作式經驗主義甚至回答了一個問題：是什麼讓反思模式值得信賴——不是更用力的自省，而是錨定在那些能反駁你的證據上。你跑這場實驗；握有決定票的，是現實，不是你的偏好。

這正是一個 AI 工具掙得自己位置的那一層，而且這個位置比那個顯而易見的位置有趣得多。顯而易見的用法，是讓這東西嘮叨著催你去達成你設下的目標——這沒問題，但很弱，因為它依然倚賴你在當下願意配合。更強的用法，是讓它守住那個觀察點。讓它當那個器具：記得你在思路清晰時實際承諾了什麼，並且按著證據真正顯示的、而不是你現在比較想記成的樣子，來要求你。這樣用，它不是一位睿智的顧問，也不是個嘮叨鬼。它是被外化的反思自我，是那個隨傳隨到的立足點——跟資訊流裡那同一套說服機器，只是被掉轉了方向，用來捍衛你選定的目標、抵禦那股衝動，而不是反其道而行。

一具引擎，兩種產出

一旦你注意到治療一直在做這件事，就會有一種誘惑，想把這套工具乾淨俐落地一分為二。一邊是 CBT，用來修正不好的行為——通常背後有一個扭曲的信念在撐著那個行為，而工作就是去駁斥它，讓現實來裁決。另一邊是接納與承諾療法（ACT），用來促成好的行為——往往根本沒有什麼錯誤的信念，你已經知道自己要什麼，而駁斥自己只會生出脆弱的意志力；這時的工作，是釐清那個價值，並改變你跟那股干擾它的衝動之間的關係。這兩個學派在技術的層次上確實有別，而這個差別值得知道，因為用錯了，是個貨真價實的失敗模式。把一個價值問題當成事實錯誤來爭訟，你會生出無窮的洞見，卻從不撼動你的行為。對一個你本該拆解的信念安詳地和解，你就是用接納去保護了那個正需要被修正的東西。這種誤診，本身就是內在的騙子愛穿的一件戲服，因為那股衝動，通常寧可被那件比較溫柔的工具來處理。

但我不認為正確的回應是兩台各自分開的機器，而看清為什麼，正是讓整個框架融貫起來的關鍵。在底層，這兩種技術做的是同一件事：製造並守護那個立足點。駁斥一個想法，跟從一個想法上解離，都不過是讓你跟你自己某一塊認知之間，拉開足夠的距離，好讓它不再未經檢視地運行下去。它們唯一的分歧，在於分隔一旦成立之後你做什麼——拿這個想法去跟現實對質，或者乾脆拒絕服從它。那不是兩具引擎。那是一具引擎——建立起觀察點——它只在行動的那一刻才分岔，而你走哪一條岔路，取決於一個問題：這件事，現實能裁決嗎，還是只有你釐清過的價值能裁決？修正一個壞行為，與促成一個好行為，結果是同一份工作、從同一個立足點做出，只在最後才分開。

而這，剛好正是你會想從一個工具身上得到的——一個用來幫你實現你真正想要的自我改變的工具，修正與增添兼具。你不需要它是兩種不同的產品。你需要它幫你誠實地建起那個立足點，然後幫你看清眼前這個處境，實際上在要求的是哪一件事。

這一切的落點

那套「失去控制」的敘事並非錯誤。它只是不完整。它正確地指認出一個強大的機制，也正確地注意到：此刻，旋鈕大多握在那些目標跟你不一樣的人手上。它止步不前的地方，在於把這個機制當成一種只能施加在你身上的東西——彷彿可選的姿態只有屈服或逃離。

還有第三種姿態，就是把這東西撿起來。資訊流未經你同意、在你身上運行的那個制約迴圈，正是你可以反過來、用它在自己身上運行的同一個迴圈，朝向健康、專注，或任何你誠實地決定自己想要的改變。但有個前提——而且是個真實的前提，不是附註——握住旋鈕，意味著為目標負責，這意味著去做那件不光鮮的工作：在你開始之前，先把自己的目標弄到自己看得明白，並建起一個立足點，讓你較好的判斷力，能從這裡盯著你較糟的那些衝動。機器能在這件事上幫上忙。它相當擅長當那個立足點。