Copy
#168(點擊閱讀網頁版)|閱讀時間 10 分鐘
不知不覺 2022 年只剩下不到兩週了,大家還有什麼今年度沒有實現的事嗎?我的話或許就是今年沒有實現我「寫更多短文」的計畫。有趣的是最近收到一封讀者來信,直說一路看《曼報》發展至今,更喜歡現在字數很多的樣子。

雖然本週的份量看起來很多,但只要挑自己想讀的深讀就好也是完全沒問題的。

希望你喜歡這禮拜的電子報,也歡迎收聽我與 Angela 共同主持的 podcast,當中有更多電子報沒有收錄的科技趨勢洞察。歡迎邀請你的朋友訂閱;若對過往期數感興趣,請 由此進入 archive

怎樣是好 AI 創投

2021 年 5 月,技術能力一流且背後有微軟爸爸支持的 OpenAI 宣布成立創投基金 OpenAI Startup Fund,起始規模為 1 億美元。OpenAI 創辦人 Sam Altman 表示這不是一般的 CVC(企業創投,通常投資較成熟、可與企業產生現在或未來綜效的公司),而是願意在少數的早期公司身上豪賭的新創基金。

​OpenAI Startup Fund 提供的不只是資金,還有一般創投相對無法提供的關鍵資源。獲投的新創除了可搶先使用 OpenAI 正在開發中的新 AI 模型,還可獲得微軟的 Azure 雲端服務資源。如今 AI 產業已經逐漸進入「產品化」的階段,在新創彼此競逐的過程中,「模型」與「運算資源」扮演了關鍵腳色。

目前市面上專注於投資 AI 項目的基金並不多,比較有名的案例有知名 AI 創業者、前 Google Brain 創辦人 Andrew Ng 於 2018 年創立的 AI Fund。不過,AI Fund 的運作模式比較接近創業工場(startup studio)而非投資基金,其標準流程是先邀請創業家進駐,經三個月驗證其概念可行後再注資前種子期(pre-seed)的資金並協助其成長。

除了一般的投資,OpenAI Startup Fund 也在 2022 年 11 月推出面向更早期新創團隊的加速器計畫:Converge。入選團隊除可獲得 100 萬美元的股權投資、參加為期五週的工作坊,也同樣享有使用 OpenAI 新 AI 模型及微軟 Azure 資源的權利。

OpenAI Startup Fund 成立以來一直沒有什麼消息,直到最近才接連公布兩個由它們領投的新創公司。

第一家是提供個人知識管理應用的 Mem,該輪金額為 2,350 萬美元,投後估值為 1.1 億美元。很難一句話形容 Mem,最接近的描述方式可能是「Notion 加 Slack 除以十」,也就是它既有記事的功能,也有整合工作項目與協作的功能,但整體設計非常輕量與個人化。

Mem 的目標是成為個人的「另一顆大腦」,一站式地管理筆記、待辦事項、信件與行事曆(後兩者必須開通 Google 權限),之後再用 AI 來強化使用者的搜尋體驗,甚至輔助使用者「聯想」。付費用戶還可使用進階版的「生成式 AI」(generative AI)功能,例如叫 AI 寫文章,雖然這點我認為即將快要成為所有生產力應用的標準配備。

Mem 讓我印象最深的功能是「Mem Spotlight」,在有安裝桌面版軟體(同時支援 Mac 與 Windows)的情況下,隨時按下「Cmd + Shift + Space」就會跳出類似 MacOS Spotlight 的對話視窗,可立即執行新增記事、將正在看的文章分享給別人、或是找出舊記事然後補充內容...等動作。

Mem 還有一個針對 Twitter 開發的功能,只要去任何一篇(串)推文底下回覆一串指令,Mem 的機器人就會將該篇(串)推送到你的記事中,並且由 AI 整理出開篇(串)推文的大意。很可惜,經過多番嘗試,我還是沒能看到 AI 整理的大意。

由於 Mem 橫跨的產品維度很廣,其潛在的競爭對手也不少,且個個來頭不小。例如,企業搜尋領域有 Gleen,知識管理領域有 Confluence 與 Notion。然而,或許正因為橫跨的產品維度廣,才顯示 Mem 的潛在價值。Mem 表示他們勝出的武器就是 AI,透過 AI 的輔助使用者將可大幅減少清理、組織知識的時間。

OpenAI Startup Fund 領投的第二家公司是比較知名、且兩年多前《曼報》也寫過的聲音編輯軟體新創 Descript。本輪 OpenAI Startup Fund 領投了 5,000 萬美元的 C 輪,且根據 The Information 取得的情報是以 5.5 億美元的估值在投。

Descript 由 Andrew Mason 創辦,他最為人熟知的身分是 Groupon 的共同創辦人,因為後來他被 Groupon 董事會給開除了。Mason 之後還創了幾次業,其中一個城市聲音導覽服務 Detour 最後被 Bose 收購,但這並未澆熄他對聲音的熱情,並於 2017 年創立了 Descript。

Descript 一開始的定位是使用 AI 技術的聲音編輯軟體,其中最知名的功能是利用聲音轉文字(voice to text)技術而實現的聲音編輯功能。使用者將聲音檔輸入 Descript 後,除可自動產出逐字稿,還能直接透過編輯文字來刪掉聲音。Descript 之後還推出了「AI 聲音複製」(voice clone)功能,例如當想修掉 podcast 中的一句話時,可以刪掉原句、輸入新句、然後叫 AI 複製自己的聲音並念出來。

2020 年起,Descript 開始切入影像領域,在核心的聲音轉文字技術以及 AI 系統上陸續加入影像編輯功能,從最基本的剪輯、調色,到如同 Canva 般的模板及圖庫資源,到更進階的 AI 自動去背等。由於 Descript 的核心強項是基於聲音轉文字的編輯體驗,用在台詞或旁白多的影片上體驗較佳。

由於 AI 產品的競爭非常激烈,不難想像為何 Descript 要快速地從聲音領域切入影像領域。例如,聲音領域有另一個也很好用、且更針對生產力場景開發的 Otter.ai。甚至在影像領域也已經出現與 Descript 非常相似的新創:Reduct.Video。

因此,對 Descript 而言,獲得 OpenAI Startup Fund 投資的重點或許不只是錢,還包括它能提供的技術與資源,畢竟「天下武功,唯快不破」,很多事情不一定靠錢能擺平。反過來說,OpenAI Startup Fund 也能透過投資的方式更深度地參與到 AI 產品化的浪潮,及早輸出其技術並看到商業驗證成果。

此時一個延伸思考是:「沒有上述關鍵資源的一般創投,能提供什麼附加價值給新創?」web3 狂潮期間,有些創投開始內建工程團隊,除用來 DD(due diligence,盡職調查)新創公司的技術是否為真以外也能提供其他附加價值。進入 AI 狂潮後,創投也要開始內建 AI 工程團隊了嗎?還是說內建團隊也不夠,必須找 AI 公司聯合才行?

無頭 CMS 浪潮

自 1995 年 FileNet 問世以來,內容管理系統(Content Management System,CMS)已經走過快 30 個年頭。如今全球最多人使用的 CMS 系統非 WordPress 莫屬,根據 W3Techs 的追蹤,高達 43% 的網站使用 WordPress,該比例不僅是第二名 Shopify 的十倍以上,更是 Joomla 與 Drupal 的二、三十倍。

2000 年代初期是「一體式」(monolithic)CMS 百花齊放的年代。一體式指的是將內容呈現(前端)與內容管理(後端)整合成一整套軟體工具。除了一體式,當時更引入了開源與免費版的概念,包括 WordPress、Mambo、Joomla、Drupal 等都在該時期問世。同時,像 Weebly、Wix 這類主打簡易架設網站的一體式架站平台也開始冒出頭。

然而,自 2007 年 iPhone 問世以降,一體式 CMS 開始遭遇到不同程度的挑戰。面對手機、平板等不同尺寸的螢幕,人們尚且可透過「將桌面版與行動版分開」或是「響應式開發」(Responsive Web Design,RWD)等方式應對。當面對更多元複雜的內容發行管道,例如要送往智慧電視的內建應用、智慧手錶、遊戲主機、電子看板…等地時,一體式 CMS 便開始有些力有未逮了。

因應前述的挑戰,「無頭」(headless)CMS 誕生了。無頭 CMS 不負責處理內容呈現方式,只負責提供內容管理;開發者可透過 API 將無頭 CMS 中的內容打給不同的發行管道。對開發者而言,無頭 CMS 解放了他們的開發能量,使其可在不觸及內容的情況下調整內容的呈現與互動方式;對內容產出者而言,無頭 CMS 也加速了其產製流程,可更有效率的進行管理與協作。

無頭 CMS 帶來的第一個巨大價值是整合上的彈性。由於無頭 CMS 的核心精神是「API 優先」(API first),開發者不須被一體式 CMS 給綁住,可自由搭配市面上的既有服務來打造最適合的架構,這些服務包括:行銷自動化、資料分析、內容翻譯、影片傳輸、個人化演算法、甚至是電商。

無頭 CMS 帶來的第二個巨大價值是降低內容產製的重複作業。在無頭 CMS 的世界中,所有內容都是以原子型態存放在一個巨大的內容庫(content hub)中,之後透過 API 來選定要打哪些內容出去。當內容與呈現都可以像是由 API 所串起的積木塊,內容生產者就可省下大量編輯重複內容的時間,甚至可以基於資料分析來針對不同使用者提供精準的內容組合。

當然,無頭 CMS 並非毫無缺點,其最大缺點就是需要投入開發人力。此外,若自家的內容發行管道並不複雜,甚至只有桌面與行動兩種版本要維護,那麼也不一定需要用到無頭 CMS。換言之,真正需要用到無頭 CMS 的多半是有一定規模且大量倚賴內容(電商的商品陳列也是一種內容)的企業。

COVID-19 疫情後越來越多企業開始重視數位體驗,也更加在意內容產製過程中發生的人力浪費。上述背景使創投提高了對無頭 CMS 這個問世超過十年的題目的關注。例如,2013 年成立的 Contentful 在 2020 及 2021 年接連完成 8,000 萬美元及 1.75 億美元的 E、F 輪融資;2018 年成立的 ContentStack 也在 2022 年完成 8,000 萬美元的 C 輪融資。

ContentStack 特別吸引我的注意,因為它的發展歷程頗有意思。2007 年,擅長行銷的 Neha Sampat 與擅長技術的先生 Nishant Patel 共同創立了顧問公司 Raw Engineering,該公司主要提供雲端、API 等新技術的策略與專案服務。2015 年 Raw Engineering 將旗下的企業後端系統整合服務 Built.io 獨立出去,並在 2018 年將 Built.io 賣給了德國軟體大廠 Software AG。2018 年,Sampat 再次與 Patel 一同創業,成立了 ContentStack。

透過以上簡短的歷程回顧可得知 Sampat 與 Patel 除了是 CMS 領域的老手,還因為從首次創業以來打交道的對手都是企業而深知其需求。相較於其他無頭 CMS 新創,ContentStack 從第一天起就主打財星 1000(Fortune 1000)的企業客戶。雖然才創立四年,ContentStack 已繳出亮眼的成績單,不只 2022 財年的營收翻倍,客戶的留存率更是高達 99%。

Sampat 在接受其投資人 Insight Partners 專訪時也提到,與許多產品新創不同,ContentStack 的創辦人與核心成員都是從企業顧問服務公司(Raw Engineering)起家,但這點帶來不少幫助,包括對企業需求的敏銳度,以及意識到「導入」(onboarding)體驗對企業客戶來說至關重要。

值得一提的是因為是服務型公司起家,Sampat 非常重視客服。ContentStack 的客服團隊不僅是 24/7 待命,處理需求的平均速度還落在 3 分鐘內,而這點也在企業客戶間傳出名號。為了查證這點是否屬實,我也上網找了一些對 ContentStack 的評價,發現許多人確實都對其售後服務讚譽有加。

第三波筆記革命

自從之前在 podcast 中回顧了近代筆記應用宗師 Evernote 的發展歷程後,就一直思考為什麼自己後來不筆記了,以至於錯過了過去五年來以 Notion、Obsidian、Roam Research、Logseq 等應用為首的第二波筆記革新(但它們現在都越來越不將自己定位成筆記應用)。直到最近發現市場上正在出現第三波筆記革新後才有了答案。

我的答案是:懶。筆記應用的問題從來不在於工具好不好用,而是使用者有沒有筆記習慣。我曾經以為只要配合工具就能學會卡片盒筆記法或子彈筆記法,結果發現順序根本反了,是得先學會方法再用工具來實踐。

不筆記的人生好像沒什麼問題,因為網路上的「外部大腦」越來越發達,不論是人人都會的 Google,或是越來越多人熟悉的生成式 AI(generative AI)。但,不筆記的人生好像也很有問題,因為根據「遺忘曲線」,當人類接收到新訊息後,在一小時內平均會忘記 50%,在 24 小時內平均會忘記 70%,經年累月累積下來的損失相當可觀。

然而,最近卻意外發現有越來越多新興的筆記(暫時用這個形容)應用正試圖服務我這種懶人,且大部分的應用都會提到一個英文單字:serendipity。Serendipity 曾被評選為十大最難翻譯的單字,其意思為「意外發現有價值或認同的事物的現象或能力」。過去曾有人翻作「偶然力」,雖然我覺得這更難理解,但為了方便書寫以下還是用它。

以下介紹三款強調偶然力的筆記應用。

首先是我認為偶然力最弱但名字取最好的 Lazy。Lazy 主打「超強的資訊擷取」(capture),在桌面環境中只要按下熱鍵就能叫出一個類似 Spotlight 的視窗然後開始擷取資訊。除了一般網頁,Lazy 還能擷取 Twitter 推文,甚至是透過「聲音轉文字」技術擷取一段 YouTube 影片的語音內容。Lazy 也支援跨裝置的擷取與同步,行動版應用也有光學字元辨識(OCR)功能,可複製照片上想要的文字。

超強的資訊擷取有時反而是場災難,因為事後整理很麻煩,而不整理的資訊庫久而久之就會造成使用者的心理負擔。Lazy 提供的管理功能頗為一般,像是擷取回來的資訊可以拖放進不同的分類中、每個資訊都能建立雙向連結、擁有基本的搜尋功能等。

整體而言 Lazy 是個頗需要「手動」的應用,包括手動擷取以及手動整理,而我認為手動成分越高的應用就越難帶給使用者「偶然力」。此時讓我想到了第二個應用:Mem。

Mem 的擷取介面近似於 Lazy,一樣是按下熱鍵後就能叫出一個類似 Spotlight 的視窗,只不過性能比 Lazy 弱一些。然而,Mem主打的是知識型工作者的「第二顆生產力大腦」。除了使用者主動截取的資訊,Mem 還可串接電子郵件信箱、行事曆等生產力應用,最後透過擁有「自然語言處理」能力的 AI 將資訊有效地遞送給使用者。

例如,使用者可用自然語言在 Mem 中搜尋過往的記事或擷取的資訊。輸入「今年三月份的年成長率是多少」,結果會跳出第一季的財報試算表,或是今年三月底的財務會議筆記。

例如,當創建或編輯一份記事時,Mem 會根據使用者輸入的內文自動推薦與這篇記事有關的其他資訊,可能是另一篇記事、某一個檔案、某一篇擷取的文章,甚至是某一封信,以此協助使用者建立連結網絡。

換言之,Mem 的產品願景是使用者不需要花大量時間手動整理、分類就能在對的時候獲得對的資訊。「我根本忘記丟了什麼東西進去 Mem 但它卻正確地找出來給我」的體驗也許就是「偶然力」。若用更擬真的方式來比喻,Mem 的終極樣貌就像是一個跟你合作無間的秘書。

Mem 的 AI 真的有這麼厲害嗎?我在用了一週後的心得是:還好。然而,Mem 有一點可以讓人多少抱持著期待,那就是它最近剛完成 2,350 萬美元的融資,而領投方是由目前最知名的 AI 公司 OpenAI 所設立的投資基金 OpenAI Startup Fund。

雖然 Mem 已經很接近我的懶人需求(不太需要手動整理),但它還是需要我手動擷取與紀錄。我曾經在與 Angela 閒聊的時候說:「昨天我在書店翻到一本書,裡面某句話好讚但現在想不起來。如果我的一整天都可以被錄起來,且做的每一件事都能被精準地搜尋該有多好,這樣就不需要準確地記得任何事了。」

正所謂點子不值錢,我以為的狂想如今已有人做成產品,它就是最近剛以 7,500 萬美元的估值完成 1,000 萬美元融資的 Rewind,領投方是 Andreessen Horowitz(a16z)。

Rewind 是一個很瘋狂的應用:錄下你一整天的電腦使用畫面,並且讓你完整的搜尋它。只要是畫面上曾出現的文字都可被搜尋,錄影畫面上的網址還能直接點擊。甚至是「語音」都可以被搜尋,因為 Rewind 會自動捕捉視訊會議應用(目前僅支援 Zoom)的音訊然後透過「聲音轉文字」技術自動生成逐字稿。

「早上老闆好像傳了一則訊息說 A 廠商的報價是多少」,忘記了嗎?叫出 Rewind 搜尋。「中午好像讀到一篇文章說了某某趨勢」,忘記了嗎?叫出 Rewind 搜尋。「下午的 Zoom 會議上印度同事講了一個技術架構但沒聽清楚」,忘記了嗎?叫出 Rewind 搜尋。

擔心 Rewind 會侵犯隱私嗎?不用擔心,因為所有的錄影跟搜尋都發生在本機端。擔心錄下一整天的電腦使用畫面很占容量嗎?透過獨家的壓縮演算法,Rewind 錄製的檔案大小平均為原始檔的 1/3750,實測結果是平均每人一個月只使用 14 GB。

Rewind 是我目前認為最接近「偶然力」的筆記應用,甚至已經與筆記無關。未來 Rewind 如果能搭載如 Mem 一樣、或更強的 AI 將能做到更多事,簡單如支援自然語言搜尋,複雜如當我瀏覽行事曆時自動辨識出今天的行程並主動提醒,甚至是從每日的紀錄中自己連結出新概念(有點科幻了)。Rewind 目前唯一的限制是基於效能考量,只支援搭載 M1 及 M2 核心的 Mac 電腦。

正所謂「無招勝有招」,懶人如我的夢想一直是「真正的筆記是不用筆記」。人腦的限制就用外置大腦解決,AI 能解放的不只是一成不變的瑣碎生產力工作(例如寫大量相似商品的文案),還能讓人們「無後顧之憂」地盡情吸收資訊。

雖然「人腦只用到 10%」這個說法是都市傳說,但 Rewind 讓我看見人類是有機會克服「遺忘曲線」的。某種程度上,這也是解放了人腦的使用限制。
【工商資訊】最近讀了《經濟學人二〇二三全球大趨勢》,備感震撼,因為...世界上的壞消息真的太多了。有趣的是雜誌的總編輯 Tom Standage 以及超過 20 位的菁英講者都將出席明年的「2023 天下經濟論壇」。由於我也會去這場活動,希望到時能聽到不一樣的洞見。對活動感興趣的人,結帳時輸入「MANNYCWEF」還可現折 1,000 元!
點擊訂閱《曼報》
Facebook
Instagram
Copyright © 2022 manny-li.com, All rights reserved .


如果你真的不希望收到這份電子報,點擊取消訂閱。