松易涅

松易涅

原创作品遵循 CC BY 4.0 国际许可协议。All original works are licensed under CC BY 4.0. 博客/Blog: sungyinieh.com
email
follow

信息備忘錄V11

本期信息#

截取時段:25/02/12-18

關鍵詞:梁建章,人口學,大學,教育回報率,精英教育,人際交往,特權,家庭關係,婚姻,deepseek,思維鏈,AI,蔣能杰,弱勢群體,獨立製片人,紀錄片,獨立電影,網盤導演,電影行業


信息流#

【攜程梁建章在 TOP 刊發文了,為啥在教育回報極低的今天你也必須給我上大學?】#

(梁建章,人口學,大學,教育回報率)https://mp.weixin.qq.com/s/upcy9SCpFftjmhPz-lEPPw

模擬 Simulation 更直觀:如果單純擴招大學生(供給衝擊),所有學歷群體的工資都會下跌,這與現實不符。只有當技能需求同步提升(需求衝擊),才能復現 "新人跌、老人漲" 的真實趨勢。這說明大學擴招本質是對產業升級的主動適應,不能簡單貼上 "教育過剩" 標籤。因此,人力資本投資要看長期價值,不能因短期市場波動否定教育投入。發展中國家即便加速擴招,也難以在短期內複製發達國家數十年積累的經驗型人才儲備。就像釀酒需要時間,經驗積累的 "陳化過程" 無法速成,這提醒咱們的政策制定者要用更耐心的眼光看待人才培養。

【中國教育明明和歐美精英教育一樣卷, 為什麼很少有人去抨擊歐美的精英教育?】#

(精英教育,人際交往,特權)https://www.zhihu.com/question/3291267744/answer/91515820151

人類這種裸猿,是極度社會化的動物,會不自覺地從周圍人那裡吸收價值觀、思想、技能和欲望。那些最終成就非凡的人,他們在成長的關鍵時期,往往都是被一群同樣非凡的成年人所環繞。…… 這些父母都極力營造了一個豐富的知識環境。

【廣西 “吃貓逼婚” 事件,背後最殘酷的真相是什麼?】#

(家庭關係,婚姻)https://mp.weixin.qq.com/s/lLDpb4DvVv9YtNEi0X4J_A

這是服從性測試。就是為了讓孩子聽話而已。殺了你最在乎的東西,你若不吭聲,不反抗,那好,從此你就被他們狠狠拿捏。而若是你反抗,你憤怒,你掙扎,那你就是不孝,就是不顧念親情。在很多細節上,長輩一定要在晚輩面前展示絕對的權威,於是,他們不斷地試探。最終,他們收穫了一個唯命是從的孩子,他們的目的就達到了。

【萬字賞析 DeepSeek 創造之美:DeepSeek R1 是怎樣煉成的?】#

(deepseek,思維鏈,AI)https://mp.weixin.qq.com/s/Pbha8I1-j174ra9uWXG32Q

Peak 曾經給我說過一個直擊本質的觀點。大家知道,語言模型的本質是激活一個龐大的神經網絡矩陣。當輸入一個 token 時,它能夠激活矩陣中的某些部分,但這種激活是有限的。當輸入更多的 token 時,能夠激活的部分也更多,信息量隨之增加。因此,更多的 token 意味著模型能夠得到足夠信息,從而做出更為精準的決策。
模型需要更多 token 來「思考」,這也促使我們提出了推理模型(Reasoning Model)的概念。
什麼是推理模型?比如,我們可以用一個例子來說明。假設我們問一個問題:「從望京西到西直門坐地鐵需要幾站?」一個「直接回答型」的模型可能會像下圖左邊直接回答:「九站」。
而推理模型則會做出右邊的回答。它首先會考慮多種換乘路線,接著比較各路線的換乘站數,最後綜合得出最佳方案。推理模型不僅僅給出答案,它還會展示其思維過程。
……
首先,文章提到 9 月 12 日 o1 發布,舉世震驚,隨後團隊注意到 long CoT 極為有效。他們意識到必須投入 long CoT,否則就會被甩在後面。因此,他們開始思考如何從 OpenAI 的工作中獲取靈感,並在研究過程中發現了兩個關鍵視頻。
這兩個 OpenAI 發布的視頻並不是 9 月份的分享,而是更早的演講 —— 由 Noam Brown 和 Hyung Wong Chung 主講。這兩個視頻直到 o1 發布時才被公開,讓他們去想:為什麼選擇這個時間點放出這些視頻?一定與 o1 訓練有某種關係。
當時我看到這個分析,心想:「這思考角度太牛了。」於是,他們深入研究這兩個視頻,首先在 Noam 的視頻中發現了一張關鍵的 slide,提到了 AlphaGo 及其後續版本 AlphaGo Zero。大家都知道,AlphaGo Zero 是一個完全基於強化學習(RL)的版本,而這張 slide 強調了 Test-Time Search。
許多人認為 Noam 強調這部分是為了講解 AlphaGo 的 MCTS,即蒙特卡羅樹搜索 —— 同時探索多條路徑,評估得分,最終找到最優解。但 Kimi 團隊有一個非共識的判斷:他們認為 Noam 其實是在強調 MCTS 中的 S,即 Search 本身,而非具體的 MCTS。這一認知帶來了他們的第一個關鍵想法:讓模型自行搜索!讓模型自己學會探索不同路徑,而不是人為限定其思考方式。
這讓他們聯想到 Richard Sutton 著名的演講《The Bitter Lesson》。
第二個視頻的內容同樣至關重要。他們總結出一個核心觀點:「Don’t teach, incentivize.」也就是說,不要去「教」模型,而是要「激勵」它自主探索。
在許多實驗中,模型的結構約束越少(less structure),當計算資源增加時,最終性能的上限就越高。反之,如果在早期給模型加入過多結構約束,它的最終表現可能會受到限制,失去了更多自主探索的可能性。
他們進一步思考:為什麼這個同學特別強調 structure?什麼是 structure?當時我讀這個特別爽,是因為我好像在看 Kimi 這個同學的腦內對話。
MCTS 是 structure,A * 算法也是。這些都在限制模型的自由思考能力。他們認為,OpenAI 發布的 PM-800K 訓練方式也存在類似的問題 —— 它通過一個成型的推理數據集,告訴模型在不同情況下應該如何思考。這實際上是人為設定了一種思維路徑,限制了模型自身的探索能力。
最終得出結論:o1 沒有限制模型如何思考。這一點特別特別重要。Kimi 團隊因此決定不採用 MCTS。
……
基於這個模型,他們採用了純強化學習進行訓練,但過程本身極為簡單。他們訓練時使用了一個固定的模板。
現在大家對 AI 產品應該比較熟悉,可以將其理解為 system prompt。具體來說,該 system prompt 設定為「這是一個用戶和 assistant 之間的對話」,用戶提問後 assistant 進行解答。但是該 assistant 需要先「在腦海中思考推理過程」,然後再給出最終答案。此外,assistant 還必須將推理過程標註在 think 標籤內,而答案則放在 answer 標籤內。
……
R1 Zero 路走對了,但接下來 DeepSeek 團隊發現了 R1 Zero 的一些問題。首先,可讀性較差。第二是經常出現語言混雜的問題,類似於上海外企白領的說話方式:「Maria,今天這個 schedule 有些滿」。
這個問題不僅僅出現在 R1 Zero,大多數推理模型都會有這種語言混雜的問題。
就像最近有一個梗,不知道大家有沒有看到。國外有些網友截圖了那個 o3 的思考過程,發現當 o3 用英文問問題時,在用中文推理。雖然我們知道這個現象背後的真實情況,但很多國外網友還是截圖並 @Sam Altman,問你們是不是在蒸餾 DeepSeek R1。天道輪回。
其這背後的原因很簡單。就是模型自己在探索時,對模型來說,無論是中文還是英文,都只是個 token。它自己在思考時,按照 token 來處理問題,而不在乎人類是否能讀懂。這實際上是一個語言混合的問題。

筆記#

訓練 AI 的思維鏈,即是在一定程度上復現人類的邏輯推理模式。

【我們出圈了?豆瓣知名 “網盤導演” 拍了部無法公映,但閱讀量 10 萬 + 的片】#

(蔣能杰,弱勢群體,獨立製片人,紀錄片)https://zhuanlan.zhihu.com/p/358299999

2016 年,我有幸入選 “銀杏夥伴”。我們有一個銀杏海外考察項目,有一位夥伴叫馮璐,她是做關注心智障礙群體服務的,很巧,我們倆都參加了日本和澳洲的考察學習。我們一起去參觀學習那邊殘障機構,還有感受那邊的服務,城市建設對殘障人士的照顧,深刻體會到他們對弱勢群體的關照,特別是日本。當然,對待弱者的態度,是一個國家文明的標誌。

【網盤上的導演:“讓我走一走電影這條路”】#

(獨立電影,網盤導演,電影行業)https://m.thepaper.cn/baijiahao_7555277

承嘉斌向南方周末記者坦承,國內獨立導演正陷入一個不良的閉環:由於缺乏資金難以拍出高品質的作品,又因為不願意妥協而習慣性選擇拍攝偏向自我表達的作品,最後往往效果不佳。“獨立導演大部分拍的都是作者電影(注:泛指具有明顯個人風格特徵的影片),他們拍自己的生活,沉浸在某種比較興奮的狀態中,但這會導致他們沒法考慮觀眾的感受。”
王思的電影獲得過南亞兩個電影節的獎項,也入圍過英國和意大利的幾個小電影節。他在參加某電影節時,看了很多國家的片子,感覺 “世界電影正在往小裡發展”—— 有人拍大海上的一塊石頭;還有人就拍一個人走路,走了整整三個小時……
王思曾在 B 站上用自己的視頻做過測試,一天剪幾個視頻,放在幾個不同的頻道,發現網友喜歡的還是娛樂內容。他感到失望,“那些火的視頻都是通過貶低自我價值實現的”。


想法#

為何關注 706 青年空間:消失的附近與公共生活#

有朋友先後問過我,為何關注 “706 青年空間”、“1200BookShop” 這類實體存在。有四個原因:充實私人生活的空缺;結識更多的人;接觸更多視野外的信息;尋找失去的 “附近” 與公共生活。

動機源自個人生活的無聊。以家為中心、方圓 5 公里內,驚訝地發現找不到有趣的公共活動及場所,絕大部分都私有化、私密化了,比如 KTV、網吧、桌球。

20~30 歲之間的 “青年” 是很矛盾的群體,處於中間態,既延續青少年的活力、青澀與迷茫,又染上了成人社會的憂鬱與不安;暫且無法融入中年人群體,又無法退回以學生為主的小孩子們的社會;在宰制個體的家庭生活中部分地解脫,但又受個人生活 “空虛寂寞冷” 的困擾。可以認為,青年是人生中躁動不安的過渡階段。

朋友給我推薦了一本書《科學與尊嚴》,巧的是,我在 zlibrary 搜到了肖索未著的《欲望與尊嚴:轉型期中國的階層、性別與親密關係》,序言提及:「不管怎樣,21 世紀以來,風險社會帶給現代人的不確定性和不安全感與日俱增,並日益滲透在人們對於家庭這一古老制度左顧右盼的糾結態度中。尤其對於處在所謂 “壓縮的現代性” 中的東亞社會來說,一方面在老齡化和少子化的不可逆轉的趨勢下家庭已經變得分崩離析,另一方面國家與個體對於家庭的依賴感似乎有增無減。在這種狀態下,關於現代核心家庭的神話在應對變動的社會方面似乎顯得力不從心,而遊離於家庭與社會之間的個體空舉著自主的旗號,卻面臨著不知將自己安頓於何處的無家可歸感。」

這段話點醒我:青年,既無家可歸,又夾在私人生活和公共生活,渴望與他人、與社會對話,渴望有個 “家”。

每個社會的公共生活,都是 “私密”、“半公共”、“全公共” 三種場所及活動的共同構成的。然而,商業地租上漲、互聯網社交擴張、當局嚴防聚眾集會的組合拳,使得大部分實體空間被資本收入囊中,成為消費主義的陷阱 —— 商業街、商超、遊樂設施等消費場所興起。於是乎,我尷尬地發現,能夠線下約人齊聚一堂聊聊天的活動,大多都成為了消費場景,比如吃飯、唱 K、喝酒、上網。否則就約出來逛街、逛公園、逛展覽、逛博物館……

在實體空間上,項飚說的 “附近” 消失了,就連一個個 “附近” 所承托的公共生活也失去蹤影。

大大小小的 “706 空間” 解決了線下活動場所的 “半公共半私密” 需求。線上的信息媒體與社交平台,無不受監控,受規制,討論公共議題往往難以取得成效:要麼大家主動回避公共議題,不敢談;要麼 “說多了”,被平台方或社群管理方請走。線上不敢談、不能談的話題,線下可以大大方方談,甚至可以面紅耳赤地談。轉戰線下,新的問題出現了:我們缺乏滿足 “半公共半私密” 性質的場所 —— 公園、圖書館等屬於公共場所,不受控制,毫無隱私;而誰敢請不太熟的網友、陌生人直接到自己家做客?假設你要舉辦一場公開活動,那麼只能尋求 “706 空間” 這類半商業化甚至全商業化(如廣州 “木雞茶社”)運作的實體場所的支持了。

中產階級與世界政治經濟格局#

「我們知道世界政治經濟版圖在過去幾十年發生了深刻的變化,中國有些學者討論 “東升西降”,也有人提出不同看法。從數據來看,確實發生了東升西降。比如美國今天與 1960 年代相比,GDP 實際上下降了 50%,而中國則從一個比較弱的發展中國家變成了世界第二大經濟體。如果將東升西降放在整個亞洲跟傳統意義上的北美或歐洲相比,就更明顯了。根據世界銀行的研究,到 2030 年,世界最大的五個中產階級國家有四個在亞洲,包括中國、印度、日本、印尼,唯一不在亞洲的就是美國。這也說明,整個世界的政治經濟版圖,尤其是經濟版圖,發生了根本性變化。」(https://www.hnzk.gov.cn/zhikuyanjiu/19024.html)

消費權力和技術權力是當下最主要的兩個權力。誰擁有消費能力的較大規模人口市場,誰掌握消費權力。誰控制高技術產業鏈關鍵環節,誰就掌握技術權力。這兩個權力都會更替易主。

根據中產階級群體分布,漢語、日語、印度語、印尼語將(已)是除英語外的次要工具性語言。非洲尚處起步,預計我 40 歲往後才可以享受中非交往紅利;其中各國語言混雜,部分沿用法語,故也可考慮學法語。歷史一再證明,政治組織度是人類社會最強大的力量,盧旺達未來可期;剛果(金)或陷入長期混亂。

當中國和印尼發展起來,意味著東亞、東南亞也跟隨發展,中東相對穩定,亞洲(中華文化圈)將真正成為歐洲和美洲外的另一極。這時候就是 “東升西降” 的標誌。

載入中......
此文章數據所有權由區塊鏈加密技術和智能合約保障僅歸創作者所有。