跳到主要內容

發表文章

技術不創造商業模式!字節開源 Bernini,戳破了 AI 廣告影片的什麼假象?

字節跳動剛開源的 Bernini 影片模型,這個框架其實處理掉很多付費平台在做的事情。 同時也打破了一個假象, 『大家以為只要畫質夠好,就能直接拿來做廣告印鈔票。』就可以獲得市場的這件事情。 影片製作真正的問題從來不是算力,而是「溝通與交付的摩擦力」。 以前用文字 Prompt 生影片,只要稍微修改一個場景或加入一個特定產品,整個模型就開始瞎編,視覺風格直接漂移。這種不可控的不確定性,在商業交付系統裡就是災難。它讓流程卡死在「反覆調整」的無限迴圈,時間成本直接吃掉所有毛利。 Bernini 最值得看是實際根據『市場需求』來建立的 video framework, 而這個商業交付流程。它把「多模態理解」和「影片渲染」拆成兩個獨立的工作流。 先讓模型看懂參考圖、精準規劃語意,再交給底層去渲染像素。這不是單純的技術升級,這是為了解決商業上的「精準控制」問題。 當你身邊已經有參考影片,能夠拿著一張特定的產品圖或品牌視覺作為 Reference,直接引導影片生成與局部編輯時,影片的邊際修改成本直接趨近於 0。 原本一個團隊一週只能產出一支合規的視覺素材,現在系統可以每天批量產出 100 支不同情境的測試影片。內容的交付效率提升 10 倍,CAC(客戶取得成本)直接拉低 30%,規模化能力這時候才真正發揮出來。 思考點 // 技術不創造商業模式,它只負責放大已經存在的系統效率。 // 單純的影像生成已經不值錢,能被精準控制、低成本修改的交付流程才值錢。 // 未來的內容競爭不是比誰的算力多,而是比誰的本地影音資產能先被 AI 結構化利用。 個人想法 Bytedance 放了這個大招。當影片生成的生產力被徹底解放、內容製作的邊際成本歸零時, 你的商業系統裡,還有什麼護城河是別人用 10 倍效率擊不穿的? 有什麼想法,歡迎來討論, 加入「AI for Developer」!請點選以下連結加入社群! https://line.me/ti/g2/D2m1DA83Qb0KJCjd2mLyHD7y4yB1CA0WUJsOMA?utm_source=invitation&utm_medium=link_copy&utm_campaign=default
最近的文章

當 AI 變成戰略物資:你的 API 護城河,隨時會被一道指令清空

美國政府把 Fable 5 / Mythos 5 當成可能具有國安風險的高階技術,臨時用出口管制手段要求 Anthropic 阻止外國人使用。 WHAT??? Anthropic 在 2026 年 6 月 12 日收到美國政府指令,要求停止「任何外國國民」存取 Fable 5 和 Mythos 5;範圍包含美國境內外的外國人,甚至包含 Anthropic 內部的外籍員工。 Anthropic 表示,為了避免違反命令,只能先把這兩個模型對所有客戶關掉;其他 Anthropic 模型不受影響。 Reuters 也報導,美國官員確認商務部確實發出這項出口管制指令,AWS 則被要求在所有區域撤銷這兩個模型的存取。 WHY??? 美國政府可能認為 Fable 5 / Mythos 5 已經接近「戰略級 AI 能力」,尤其在資安漏洞發現、漏洞利用、長時間自主工作等方面,若被外國對手或惡意行為者取得,可能加速網路攻擊或危害關鍵基礎設施。因此政府用國安和出口管制作為緊急煞車。Anthropic 則認為政府反應過度、程序不透明,而且技術證據不足。 個人看法 根據之前 Anthropic 反應,會透過媒體力量,立法施壓,同步遊說三步棋同時並進方式,讓美國政府鬆口鬆動。 讓大家思考的問題 - 大語言模型私人公司研發出來之後到底算是私有財還是國有財? - 政府怎麼評判是否真的具備威脅? 從某個層面來看,這作法,跟獨裁的方式無異,也讓我們從另外一個角度看到,『只能跟著老大走,你並非真的自由。』 不知道大家會有什麼想法? 歡迎加入群組討論, 「AI for Developer」!請點選以下連結加入社群! https://line.me/ti/g2/D2m1DA83Qb0KJCjd2mLyHD7y4yB1CA0WUJsOMA?utm_source=invitation&utm_medium=link_copy&utm_campaign=default

看 AI 時代的孩子,如何用嘴巴「說」出創造力

大家常問我:「現在科技發展得這麼快,到底該怎麼讓小孩子接觸?」 身為一個在軟體圈打滾多年的人,前陣子我幫兒子做了一個新嘗試,我拉了 Roblox Studio (一款現在全世界小學生都在玩的遊戲製作工具),再加上 AI 小幫手(Codex) ,讓他開始試著自己動手「做遊戲」,而不是每天只會對著螢幕「玩遊戲」。 結果,這個過程給了我大大震撼。 巨大的挫敗 首次果然是個大挫敗, 開始教他怎麼操作 Roblox Studio 整個開發介面, 同時也開許多 youtube 教學(自己認為很簡單)讓他知道如何入門, 想當然爾,超級失敗,沒有五分鐘就跑開閃人了,留下一句,『無聊的爸爸』 震撼:AI 時代的小孩,根本不用「學鍵盤打字」 我們這代人學電腦,都要先背鍵盤、學打字、記按鈕、熟悉一大堆複雜的操作流程。但我發現,這群「生來就有 AI」的孩子完全不一樣。 他甚至不打算用鍵盤。我後面發現,他已經透過 Mac F5 的功能流暢的進行語音輸入,他直接用大聲說話(語音輸入)的方式,劈頭就對 AI 下指令,讓 AI 去幫他寫程式、調功能。這流程順暢到像在跟朋友講話,前置作業基本上是「秒上手」。 這點醒了一件事: 打字,是我們那時代的事情, 如果在這個時代,我們還逼孩子非得先花幾個月去死背工具、熟悉死板的流程,才准他們開始操作,那絕對是最糟糕的學習體驗。 他們缺的不是聰明,而是「耐心」 說真的,現在的孩子被短影音、快節奏的網路餵養,最缺乏的就是「耐心」。 要怎麼讓他們重新找回「願意沉下心來做好一件事」的樂趣? 過去那套「苦行僧式」的學習法已經行不通了。 我們必須透過 AI 的即時回饋,把流程重新規劃, 先用 AI 快速實現想像力 ,讓他看到成果。 引導他去探索: 怎麼在 Roblox 商店裡挑選免費的3D素材?怎麼利用官方的公開資訊,組合出自己想要的效果? 一開始,我只給了他非常粗淺的入門教學。 但我後面發現,只要點起那把火,後續的發展完全超乎想像——他開始瘋狂挖出自己平常的「遊戲經驗」,把腦袋裡那些酷炫的打鬥效果,一項一項透過 AI 實做出來。 從「消費者」變成「創造者」 最後,他真的東拼西湊,做出了一款他自己邊玩邊大笑的遊戲。 他甚至自己一臉嫌棄地戲稱:「 這絕對是全地球最難玩、最爛的 99夜( ...

AI 第二大腦,其實沒那麼玄

最近看到很多人在討論: Obsidian + Claude Code 可以打造 AI 第二大腦。 聽起來好像很硬、很技術、很像工程師才會用。 但如果用簡單一點的方式講,其實它在做的事情是: 把你散亂的筆記、資料、靈感、專案,整理成 AI 看得懂的知識庫。 這樣之後 AI 就不只是回答你通用答案,而是可以根據你的資料,幫你整理、查找、產出內容。 為什麼這件事值得關注? 因為現在大家不是沒有資訊。 反而是資訊太多。 我們每天可能都有: 會議紀錄、課程筆記、文章收藏、靈感備忘、專案資料、聊天紀錄、AI 對話、客戶需求、研究資料、內容素材。 但問題是: 真正要用的時候,常常找不到。 就算找到了,也要重新整理一次。 更麻煩的是,每次問 AI,都要重新解釋背景。 所以很多時候不是 AI 不夠強,而是我們自己的資料沒有整理成 AI 可以使用的樣子。 這件事可以解決什麼? 簡單說,它可以幫你把「散亂資訊」變成「可用產能」。 例如: 把課程筆記整理成重點 把會議紀錄整理成待辦 把靈感整理成文章大綱 把專案資料整理成進度報告 把研究資料整理成簡報或企劃 把過去的 AI 對話變成可重複使用的知識庫 重點不是多學一個工具。 而是讓你手上的資料,真的可以被再次使用。 誰適合? 我覺得特別適合這幾種人: 常常做筆記的人 資料很多但很難整理的人 內容創作者 學生、研究者 PM、行銷、顧問 老師、講師 創業者 想把 AI 放進工作流程的人 尤其是這種人: 明明累積很多資料,但一直沒有把資料變成成果。 這套方法可能會很有幫助。 可以怎麼開始? 其實不用一開始就搞得很複雜。 可以先分三步: 第一步:先把資料集中 先找一個地方放資料。 例如 Obsidian 這類筆記工具。 把你的筆記、靈感、專案、素材、課程內容,先集中起來。 不用一開始整理得很完美。 先做到一件事就好: 之後找得到。 第二步:讓資料有一點基本結構 不用很複雜。 先簡單分成幾類就好: 工作 學習 專案 靈感 素材 已完成資料 重點不是分類漂亮,而是你自己看得懂,AI 也看得懂。 第三步:讓 AI 幫你整理和產出 當資料有基本結構之後,就可以用 Claude Code 這類工具協助: 幫你找資料 幫你整理重點 幫你產出摘要 幫你檢查缺漏 幫你把素材變成文章、簡報、企劃或報告 這時候 AI 才會開始變得真正好用。 因為它不是憑空回答,而是根...

In the AI Era, We Do Not Lack Output — We Lack Verifiable Output

  In the AI Era, We Do Not Lack Output — We Lack Verifiable Output If we agree that AI can produce different thinking models and working methods when it takes on different roles and identities, then we should no longer use the old PM, RD, and Designer workflow to structure how work should happen in the AI era. Traditional workflows were essentially formed because humans have limited role flexibility and cannot freely switch between different areas of expertise. Over time, this created a collaboration structure based on fixed roles and handoffs. But with the emergence of AI, output capability has been greatly amplified. The real question is no longer “Who will do the work?” but rather: Who can verify whether the output is correct, feasible, and deliverable? From Prompt Output to Domain Calibration In the past, many people believed that the key to AI was the prompt. But in enterprise and manufacturing contexts, the real focus is not the prompt. The real questions are: After AI genera...

AI 時代不是缺產出,而是缺「可驗證的產出」

AI 時代不是缺產出,而是缺「可驗證的產出」 如果我們同意 AI 在不同角色與身份下,會產生不同的思考模型與工作模式,那我們就不應該再用舊有的 PM、RD、Designer 流程去組建 AI 時代的工作方式。 傳統流程其實是人類因為角色能力有限、專業無法自由切換,而長期形成的協作結構。但 AI 的出現,讓產出能力被大幅放大,真正的問題不再是「誰來做」,而是「誰能驗證它是否正確、可行、可交付」。 從 Prompt 產出,走向 Domain Calibration 過去大家以為 AI 的重點是 prompt。 但在企業與製造場景裡,真正的重點不是 prompt,而是: AI 產出後,誰來驗證? 誰來校準? 誰來把錯誤變成規則? 誰來把經驗轉成系統? 這才是企業真正能累積的能力。 當一個人使用 AI 進入自己不熟悉的領域時,AI 可以產生看似完整的結果,但使用者往往無法判斷其底層是否正確。就像 Vibe Coding 可以快速做出看似能運作的產品,但若缺乏工程、安全性、架構與測試能力,最後可能只是表面漂亮,實際上充滿風險。 製造業也是一樣。AI 可以生成設計、規格、報價、製程與提案,但這些結果若沒有被真實製造經驗驗證,就只是「看起來可行」的內容,而不一定真的能被製造、報價、量產與交付。 所以新的工作流程不應該是: PM → RD → Designer → Product → Delivery 而應該變成: 需求 / 問題 ↓ AI 產生多種可能解法 ↓ 專業角色進行驗證、校準、修正 ↓ 系統記錄可行參數與限制條件 ↓ 形成可重複使用的 AI 能力 ↓ 交付給客戶或內部流程使用 這裡最關鍵的新角色,不是傳統 PM,也不是傳統 Designer,而是前面提到的會是專注於結果產出的工作模式。 因此,AI 時代的人類『核心能力』不是單純的生成,而是『驗證。』 不是讓 AI 取代 PM、RD、Designer,而是建立一套能夠讓 AI 產出被專業校準、被數據約束、被流程驗證、被結果回饋的工作系統。 這就是「可製造 AI」的本質: 讓 AI 不只是產生答案,而是產生能被驗證、能被修正、能被製造、能被交付的結果。 Prompt 是一次性的產出。 Calibration 是可累積的能力。 AI 不只是要會生成答案, 而是...

Figure AI 這場直播,讓企業看見下一個競爭門檻:AI 從回答問題,走向親自上工

 Figure AI 這場直播,表面上看起來像是在做一件很直白的事: 把 humanoid robot 放進真實場景裡,讓大家看它怎麼工作。 它不只是一種「機器人 demo」,也不只是有趣這件事情而已。 它真正想測試的,是企業會不會開始改變一個更根本的認知: AI 到底只是軟體工具,還是已經開始具備「勞動單元」的雛形。 重要分水嶺 因為過去兩年,市場對 AI 的想像大多還停留在 LLM / AI 回應內容 寫文案、寫 code、做摘要、做客服、做知識助手。  這些都很重要,但它們本質上仍然停留在「資訊處理層」,數位流程上。 Figure 想往前推的,不是另一個更會講話的模型,  而是讓市場開始重新思考:  當 LLM 負責語意推理,AI 負責感知判讀,Agent 負責流程編排,而 Robot 負責實體執行時,企業裡有沒有一些原本只能靠人撐住的流程,開始可以被重新定義? 這場直播真正的價值 它不是在證明「機器人很酷」,  而是在試圖證明另一件更接近商業本質的事: AI 不再只是幫白領提高效率的工具,而是有可能慢慢變成企業可採購、可管理、可衡量報酬的執行基礎設施。 有更多細節可以從中探索,也更多可以知道為什麼中國一直搶佔這個機器人賽道領域。 直播連結, https://www.youtube.com/watch?v=luU57hMhkak