欧美性性性性性色大片免费,成小说人免费网站,婷婷五月第九缴情综合

搜索

APP

起點(diǎn)課堂會員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會特權(quán)

個(gè)人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導(dǎo)直播

12場專業(yè)技能直播

會員專屬社群

榮耀標(biāo)識

發(fā)布

注冊 | 登錄

深度｜吳恩達(dá)最新 Ark Invest 洞察：AI 基礎(chǔ)模型競爭激烈，訓(xùn)練成本每年下降75%，推理下降86%，大廠優(yōu)勢難長期保證

有新Newin

2024-08-11

0 評論 2687 瀏覽 2 收藏

36 分鐘

吳恩達(dá)（Andrew Ng）與ARK Invest的首席投資策略師Charlie Roberts和首席未來學(xué)家Brett Winton進(jìn)行了一次深入的對談，分享了他對Agent Systems和開源技術(shù)的深刻見解。吳恩達(dá)對Agent Systems持有高度信心，并認(rèn)為開源技術(shù)在推動(dòng)技術(shù)進(jìn)步中具有巨大潛力。

近日，吳恩達(dá)（Andrew Ng）與 ARK Invest 首席投資策略師 Charlie Roberts 以及首席未來學(xué)家 Brett Winton 展開了一次對談，吳恩達(dá)分享了關(guān)于 Agent Systems 和開源技術(shù)的一些極具啟發(fā)性的觀點(diǎn)。

吳恩達(dá)表示，他對 Agent Systems 的高度信心，認(rèn)為這些系統(tǒng)不僅已經(jīng)出現(xiàn)，而且在技術(shù)層面幾乎沒有太多的風(fēng)險(xiǎn)，主要挑戰(zhàn)在于如何有效執(zhí)行。

此外，他認(rèn)為開源所帶來的優(yōu)勢遠(yuǎn)遠(yuǎn)超越了潛在的風(fēng)險(xiǎn)，引用 GPT-2 的例子來說明，即使當(dāng)初被認(rèn)為太危險(xiǎn)而無法公開的技術(shù)，如今卻被廣泛應(yīng)用，證明了開源在推動(dòng)技術(shù)進(jìn)步中的巨大潛力。

吳恩達(dá)還特別強(qiáng)調(diào)了分銷渠道在 AI 系統(tǒng)部署中的關(guān)鍵作用。他指出，擁有強(qiáng)大的分銷渠道不僅能夠加速系統(tǒng)的發(fā)布，還能在實(shí)際應(yīng)用中快速驗(yàn)證和改進(jìn)這些系統(tǒng)，這對于 AI 技術(shù)在商業(yè)化進(jìn)程中的競爭優(yōu)勢至關(guān)重要，也預(yù)示著在未來，渠道的有效性可能會成為決定 AI 技術(shù)成敗的關(guān)鍵因素。

ARK 預(yù)測，到 2030 年 AI 軟件將會是一個(gè) 13 萬億美元的收入市場，相比之下，但今天的整個(gè) IT 支出大約為 4～5 萬億美元。

吳恩達(dá)最新 Snowflake DevDay 演講：除了下一代基礎(chǔ)模型，Agent 工作流如何推動(dòng)更多 AI 進(jìn)步？

吳恩達(dá)紅杉美國 AI 峰會談 Agent Workflow 以及 4 種主流設(shè)計(jì)模式，相比 LLM 更強(qiáng)調(diào)迭代與對話。

以下為這次對話的主要內(nèi)容：

Charlie Roberts

Andrew 是 AI 領(lǐng)域最具影響力的研究人員和教育家之一，他在多個(gè)高調(diào)的角色中都取得了巨大成就，如 Google Brain 的聯(lián)合創(chuàng)始人和領(lǐng)導(dǎo)者、百度的首席科學(xué)家、 Coursera 的聯(lián)合創(chuàng)始人，以及在 Coursera 上教授了許多最受歡迎的課程，同時(shí)還是 AI Fund 和LandingAI 等多家公司的聯(lián)合創(chuàng)始人和董事。

我覺得最讓我感動(dòng)的數(shù)據(jù)是你告訴我，全球每千人中就有一人參加過你的 AI 課程，這對整個(gè)社區(qū)和生態(tài)系統(tǒng)來說都是一個(gè)巨大的貢獻(xiàn)，真是令人鼓舞。所以，我很高興能夠與你討論 AI 的未來和其他相關(guān)話題。

Brett Winton

非常高興見到你，我想或許可以請你從概述一下你對當(dāng)前 AI 發(fā)展階段的看法開始。關(guān)于 AI 的討論很多，其實(shí)已經(jīng)有一段時(shí)間了。

有人說 AI 遇到了瓶頸，或者我們在性能上的進(jìn)步不會帶來實(shí)際的生產(chǎn)力提升。你怎么看目前 AI 的能力和未來的發(fā)展軌跡？你如何評估這個(gè)問題？

Andrew Ng

在過去的 10～15 年里，總有少數(shù)聲音在說 AI 遇到了瓶頸，我覺得這些說法一次又一次地被證明是錯(cuò)誤的。我們距離碰到瓶頸還很遠(yuǎn)，我甚至驚訝有人在這個(gè)時(shí)候會認(rèn)真這么說。

AI 是一種通用技術(shù)，它的發(fā)展已經(jīng)非常迅速，現(xiàn)在有一些新的突破即將出現(xiàn)，未來我們將看到 AI 在多個(gè)領(lǐng)域的應(yīng)用快速增長。

目前，大家對生成式 AI 和 LLM 非常關(guān)注，我們已經(jīng)能夠讓這些模型完成的任務(wù)，遠(yuǎn)遠(yuǎn)超過了目前已經(jīng)部署的內(nèi)容。很明顯，更多的推理能力、更多的 GPU 或其他類型的硬件是將更多 AI 推向世界的瓶頸，這個(gè)問題我們知道將會得到解決。

為了供應(yīng)鏈、 GPU 和其他硬件的供應(yīng)，有非常強(qiáng)的經(jīng)濟(jì)動(dòng)機(jī)來解決這個(gè)問題。因此，即使 AI 不再發(fā)明任何新技術(shù)，在未來幾年中 AI 的部署量仍會大幅增加。

當(dāng)然，更好的消息是，還有更多的新技術(shù)正在研發(fā)中，并將疊加在現(xiàn)有技術(shù)之上，推動(dòng)未來更多的應(yīng)用。

Brett Winton

總結(jié)一下，你的意思是我們現(xiàn)在擁有的能力實(shí)際上還沒有真正進(jìn)入商業(yè)市場，所以僅僅通過部署這些能力就能帶來大量的生產(chǎn)力提升。此外，在技術(shù)架構(gòu)方面的改進(jìn)還會進(jìn)一步提升能力，這是正確的理解方式嗎？

Andrew Ng

是的，事實(shí)上，我與一些有想法甚至是已經(jīng)開發(fā)出原型的人交談過，他們希望通過 AI 實(shí)現(xiàn)顯著的投資回報(bào)率，但由于各種原因，他們無法獲取 GPU ，或者成本有點(diǎn)高，或者他們沒有足夠的軟件工程師來實(shí)現(xiàn)這些想法，所以這些項(xiàng)目還沒有真正落實(shí)。

因此，已經(jīng)有很多經(jīng)過驗(yàn)證的想法可以帶來顯著的投資回報(bào)率，但由于硬件限制或其他原因，這些項(xiàng)目還沒有被部署。我百分之百相信，未來一到兩年內(nèi)，這些問題將會得到解決，這就是為什么我對未來將有更多有價(jià)值的 AI 項(xiàng)目感到非常有信心。問題在于如何獲取和部署 GPU ，以及解決供應(yīng)鏈問題。

一旦這些問題得到解決，更多的項(xiàng)目將會落地。我對即將到來的技術(shù)感到非常興奮，比如 AI Agent 或我們稱之為 Agentic Workflow 的技術(shù)?，F(xiàn)在很多人使用的 LLM 的方式是，你輸入一個(gè)提示，它輸出一個(gè)結(jié)果，然后就結(jié)束了。這就像讓一個(gè)人寫一篇文章，但要求他一次性完成，不允許使用退格鍵。

當(dāng)然，人們可以這樣寫作，但我們最好的寫作并不是這樣完成的。我們更傾向于使用迭代的工作流程，比如在線寫作，先寫一個(gè)初稿，然后進(jìn)行編輯、研究等等，這是一個(gè)更加迭代的過程，可以幫助人們交付更好的工作成果。Agentic Workflow 也類似，它能顯著提高很多 AI 應(yīng)用的準(zhǔn)確性。

當(dāng)然， Agentic Workflow 的一個(gè)瓶頸是我們需要更快的推理能力，因?yàn)槟阈枰啻握{(diào)用它，反復(fù)迭代產(chǎn)品。然而，許多人正在努力解決這個(gè)問題，我非常有信心，隨著更好的硬件上線，這些工作將會得到更大的改進(jìn)，不僅在 AI 訓(xùn)練方面，而且在 AI 推理方面，更多的工作將會完成。

我受到你們的報(bào)告的啟發(fā)，其中你們估計(jì)訓(xùn)練成本每年下降 75%，推理成本每年下降 86%。雖然我不確定這些確切的數(shù)字是否準(zhǔn)確，但我確實(shí)看到成本在迅速下降，這對于進(jìn)一步的創(chuàng)新是非常有利的。訓(xùn)練和推理成本的下降將會推動(dòng)更多的應(yīng)用。

Brett Winton

是的，我們的基本觀點(diǎn)是，不僅成本在下降，還有大量投資資金涌入，因此你將成本下降和投資資金相結(jié)合，最終在兩到三年內(nèi)預(yù)期能力提升一百倍甚至一千倍。

你認(rèn)同像 John Locond 所說的那樣，系統(tǒng)在運(yùn)行時(shí)會有一定的錯(cuò)誤率，即使是 Agent Systems ，這個(gè)錯(cuò)誤率會隨著時(shí)間的推移而累積，實(shí)際上你正在處理的工作流程越長，生產(chǎn)力就越會受到影響，因?yàn)殄e(cuò)誤在累積。

你認(rèn)為在當(dāng)前的架構(gòu)下，這個(gè)問題是可以克服的嗎？還是我們需要新的架構(gòu)來讓 Agentic Workflow 真正穩(wěn)定地工作？

Andrew Ng

如果你在做開放式工作流，那么是的，每一步都需要完美無缺，但是一旦你實(shí)現(xiàn)了 Agentic Workflow ，你就可以回顧步驟并修復(fù)錯(cuò)誤，那么累積問題就會大大改善。舉個(gè)例子，我曾經(jīng)設(shè)定了一個(gè)非常簡單的 Agent 來進(jìn)行在線研究，它的任務(wù)是撰寫一份報(bào)告。

我記得我在斯坦福大學(xué)做現(xiàn)場演示時(shí)，由于某些原因，那個(gè)時(shí)候調(diào)用的網(wǎng)絡(luò)搜索失敗了，我當(dāng)時(shí)心想“糟糕，演示要失敗了”，但出乎我意料的是， Agent 說“網(wǎng)絡(luò)搜索失敗了，讓我用維基百科搜索代替吧”，而我完全忘了我還給它設(shè)置了維基百科搜索的備用方案。所以， Agent 在面對失敗時(shí)能夠自主切換到備用方案，演示仍然成功了。

Agentic Workflow 雖然不是魔法，也會犯錯(cuò)，但它們有能力在出錯(cuò)時(shí)回顧并修復(fù)，這使得系統(tǒng)更加穩(wěn)健。我不想過分類比 AI 和人類，它們有很大不同，但就像人類一樣，我們在做事情時(shí)第一次可能不會成功，但我們有反思和修復(fù)的能力，這使得人類在執(zhí)行任務(wù)時(shí)更加穩(wěn)健。AI Agent 也能夠做到這一點(diǎn)。

Brett Winton

你認(rèn)為要實(shí)現(xiàn)真正的 Agentic Workflow ，我們是否需要一個(gè)像 Transformer 那樣的架構(gòu)級別的改進(jìn)？還是說可能通過有效結(jié)合現(xiàn)有的工具，比如 LLM，加上強(qiáng)化學(xué)習(xí)，甚至可能再加上擴(kuò)散模型，已經(jīng)足夠了？你覺得目前這些工具能幫助我們實(shí)現(xiàn)這一目標(biāo)嗎？

Andrew Ng

Agentic Workflow 在現(xiàn)有的 Transformer 模型下已經(jīng)工作得很好了。我知道有研究人員在探索 Transformer 替代模型，這些模型很有前景，值得進(jìn)一步研究和測試。雖然擁有更好的模型會很棒，但我并不認(rèn)為這是絕對必要的。

然而，有一個(gè)方面被低估了，那就是快速推理和快速生成控制的能力。直到最近，很多大公司都在花費(fèi)巨額預(yù)算購買 GPU 用于訓(xùn)練，這很好，因?yàn)樗鼮槲覀儙砹舜笠?guī)模的基礎(chǔ)模型，包括專有和開源的模型。

但我發(fā)現(xiàn)，快速推理的能力正成為許多應(yīng)用的瓶頸。當(dāng) Meta 發(fā)布 Llama 3 70B 模型時(shí)，這是一個(gè)非常出色的開源模型，如果我們能將推理速度提高 10 倍，我們就能讓這些 Agentic Workflow 運(yùn)行得更快。

對于人類來說，閱讀速度大約是每秒 6 個(gè) token ，所以你不需要生成比每秒 6 個(gè) token 更快的內(nèi)容。但對于 Agentic Workflow 和 AI ，可能需要草擬草稿并修復(fù)錯(cuò)誤，這意味著它需要生成大量的 token ，可能需要在人工干預(yù)之前完成大量工作。

有時(shí)， Agentic Workflow 可能需要花費(fèi) 25 分鐘的時(shí)間來處理工作，如果我們能將這 25 分鐘的處理時(shí)間壓縮到2分鐘，這將是一個(gè)改變游戲規(guī)則的突破。

這會顯著改變客戶體驗(yàn)，從20到25分鐘縮短到1到2分鐘，因此在快速生成 token 方面還有很多工作要做，這將有助于推動(dòng)下一波 AI 的應(yīng)用。

Brett Winton

這些工作與訓(xùn)練密切相關(guān)，對吧？AI 推理和訓(xùn)練中的一個(gè)有趣動(dòng)態(tài)是，如果我在系統(tǒng)上投入更多的訓(xùn)練資金，像 Meta 正在做的那樣，我可以將更多的信息壓縮到一個(gè)更小的參數(shù)模型中，從而可以更快、更便宜地運(yùn)行。

這使得性能提升和成本下降同時(shí)發(fā)生，這就是一個(gè)有趣的動(dòng)態(tài)，這取決于你在訓(xùn)練計(jì)算上投入了多少資金。

Andrew Ng

是的，這些都會有所幫助。即使你使用一個(gè)大型模型，比如一些商用網(wǎng)站上的 LLM 可能每秒生成 10 個(gè) token 左右，這個(gè)速度已經(jīng)非?？炝?。

我們大多數(shù)人每秒閱讀大約 6 個(gè) token ，所以每秒 6～10 個(gè) token 的速度已經(jīng)足夠了。雖然模型不同，但我們可以生成更多的 token ，而且有些公司也在生成每秒數(shù)百個(gè) token 的內(nèi)容。還有一些公司在私下里分享說，他們也在開發(fā)便宜且超快的 token 生成技術(shù)。

這些公司的工作將解鎖許多新的能力，而這種超快的 token 生成技術(shù)，每秒超過100個(gè) token 對于大模型來說是非常重要的，這讓我們能夠做出非常復(fù)雜的事情。我實(shí)際上很高興看到更多的半導(dǎo)體制造商認(rèn)真對待推理，因?yàn)橥评憩F(xiàn)在是很多應(yīng)用的瓶頸。

另一個(gè)有趣的現(xiàn)象是，一些大公司完全合理地投資了 GPU 基礎(chǔ)設(shè)施用于訓(xùn)練，他們擁有非常出色的 GPU 團(tuán)隊(duì)，建立了卓越的訓(xùn)練基礎(chǔ)設(shè)施，然而，這些團(tuán)隊(duì)也傾向于說“我們已經(jīng)建立了最佳的訓(xùn)練基礎(chǔ)設(shè)施，那么我們也來建立推理基礎(chǔ)設(shè)施吧”，因?yàn)樗麄冊谟?xùn)練方面做得很好，所以自然就去做推理了。

但是，我們現(xiàn)在應(yīng)該認(rèn)真思考，訓(xùn)練和推理基礎(chǔ)設(shè)施是否應(yīng)該是同一套基礎(chǔ)設(shè)施？還是說它們之間有足夠的差異，甚至需要新的架構(gòu)？這是一個(gè)值得討論的問題。

Brett Winton

當(dāng)然，如果是在終端設(shè)備上，它們肯定是不同的，對吧？例如，如果我要在特斯拉車輛中安裝芯片，這就是完全不同的架構(gòu)棧了。你可以辯稱，從消費(fèi)者的實(shí)用性角度來看，有很多令人信服的理由說明為什么有些甚至大部分的處理應(yīng)該轉(zhuǎn)移到終端設(shè)備上。

Andrew Ng

是的，在設(shè)備上的確如此，即使是在云端，訓(xùn)練和推理工作流之間也存在足夠的差異，這值得我們從架構(gòu)和軟件堆棧的角度進(jìn)行思考。

Brett Winton

Andrew ，在教學(xué)方面，你的一大貢獻(xiàn)之一就是強(qiáng)調(diào)人們和開發(fā)人員在學(xué)習(xí)機(jī)器學(xué)習(xí)時(shí)需要關(guān)注 MLOps ，不僅是研究方面，還有實(shí)際應(yīng)用。我想知道，在 MLOps 中，你是否看到未來有可能將推理與訓(xùn)練分開進(jìn)行的趨勢？

Andrew Ng

是的，因?yàn)?LLM 應(yīng)用還是很新，所以 LLM Ops這個(gè)領(lǐng)域還在探索階段，如何構(gòu)建、部署和維護(hù) LLM 仍然是一個(gè)相對新的領(lǐng)域。

AI 堆棧正在發(fā)生巨大變化，云服務(wù)提供商正在推出有趣的編排層，比如 Harrison Chase 在 LangChain 上做得很好，Jerry Liu 在 LlamaIndex 上也做得很好，這些都是編排層。

還有其他應(yīng)用程序構(gòu)建在這些基礎(chǔ)之上，另一個(gè)即將出現(xiàn)的有趣框架是 Agentic Framework，這可能是另一種編排層。

我花了很多時(shí)間在應(yīng)用層，因?yàn)槲野l(fā)現(xiàn)有很多機(jī)會，比如在 AI Fund，我們與企業(yè)合作，他們帶給我們很多用例，我們環(huán)顧四周，發(fā)現(xiàn)幾乎沒有競爭對手。這說明在應(yīng)用層面仍然有很多新機(jī)會，而且競爭沒有基礎(chǔ)模型層那么激烈。

Brett Winton

對于那些應(yīng)用層面的公司，他們?nèi)绾嗡伎甲约航尤氲牡讓幽Ｐ?，比如基礎(chǔ)模型？他們是選擇使用現(xiàn)成的 GPT-4 ，還是會設(shè)計(jì)成能夠切換到另一個(gè)基礎(chǔ)模型？或者他們會對 Llama 進(jìn)行微調(diào)？你怎么看待應(yīng)用層面在競爭中的策略，以及它將如何影響底層堆棧的競爭？

Andrew Ng

這個(gè)領(lǐng)域變化非?？?。在很多項(xiàng)目的初始階段，團(tuán)隊(duì)往往會使用 GPT-4 ，最近幾周， Llama 3 變得越來越有競爭力，我聽到很多團(tuán)隊(duì)使用 GPT-4 ，這在當(dāng)前是最常見的選擇。

但一個(gè)瓶頸是評估，開發(fā)成本和時(shí)間比以前大大縮短，你可以在一天內(nèi)構(gòu)建出一個(gè)有吸引力的應(yīng)用程序，但評估可能需要花費(fèi)更多的時(shí)間，這使得人們不太愿意切換模型。

如果你開始使用 GPT-4 ，但無法有效評估其他模型，你可能會繼續(xù)使用最初的選擇。但我看到很多人正在努力開發(fā)更好的評估工具，以便更高效地比較不同的模型。

Brett Winton

我們對 Claude 的發(fā)展感到非常興奮， Claude 是我們從風(fēng)險(xiǎn)投資基金中最早投資的公司之一，我們與公司保持密切聯(lián)系，非常看好它的前景。

您對當(dāng)前關(guān)于開源的討論有何看法？這似乎是一個(gè)非常兩極化的討論，尤其是在數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)領(lǐng)域，許多人對這個(gè)問題有非常強(qiáng)烈的看法。

Andrew Ng

開源非常重要，我們應(yīng)該盡力推動(dòng)開源，因?yàn)樗鼤屖澜缱兊酶?。我對去年反對開源的強(qiáng)烈游說活動(dòng)感到非常驚訝，這些活動(dòng)實(shí)際上會扼殺美國的創(chuàng)新，也會壓制全球的創(chuàng)新。

你可以理解，當(dāng)有人在大規(guī)模訓(xùn)練基礎(chǔ)模型上投入了數(shù)十億美元，然后發(fā)現(xiàn)其他人通過開源稀釋了這些昂貴投資的價(jià)值，這讓他們感到非常沮喪。游說活動(dòng)開始時(shí)的主要論點(diǎn)是 AI 可能會失控并關(guān)閉系統(tǒng)，這一論點(diǎn)在華盛頓特區(qū)失去了信譽(yù)。

游說者沒有放棄，他們轉(zhuǎn)而聲稱 AI 可能會被用來制造生物武器，但隨后出現(xiàn)了報(bào)告顯示， AI 并不比電子表格更容易被用來制造生物武器。

AI 不太可能制造生物武器的恐懼并沒有得到證實(shí)，這讓生物武器的論點(diǎn)失去了很大一部分信譽(yù)。

然而，游說者沒有放棄，他們現(xiàn)在的論點(diǎn)是國家安全問題，認(rèn)為開源可能會讓歐洲競爭對手受益。我對這些游說活動(dòng)的力度感到驚訝，他們不斷改變論點(diǎn)以推動(dòng)關(guān)閉開源的議程。

開源是全球 AI 技術(shù)供應(yīng)鏈的一部分，它反映了各國的價(jià)值觀。例如，很多國家使用 Google Docs ，而 Google Docs 在共享文檔時(shí)非常容易，但它在鎖定文檔時(shí)相對較難。這反映了 Google 內(nèi)部開放的文化。

而 iMessage 的端到端加密則反映了注重隱私的價(jià)值觀。每個(gè)國家的技術(shù)往往會反映其價(jià)值觀，如果民主國家不參與 AI 的供應(yīng)鏈，那么其他國家將會填補(bǔ)這一空白。

Brett Winton

撇開對開源的監(jiān)管壓力不談，你認(rèn)為在未來的狀態(tài)下， Meta 投下數(shù)十億美元訓(xùn)練這些模型并將其公開發(fā)布的努力，是否會削弱封閉的 LLM 基礎(chǔ)模型類玩家的經(jīng)濟(jì)效益？這是否會對 OpenAI 和 Anthropic 等公司的商業(yè)盈利能力構(gòu)成威脅？

Andrew Ng

目前，在基礎(chǔ)模型層面確實(shí)存在挑戰(zhàn)。根據(jù)你們的報(bào)告，成本每年下降 75%，這使得保持領(lǐng)先地位變得非常困難。

令人沮喪的是，你可能花費(fèi)了 1 億美元來訓(xùn)練一個(gè)模型，但一年后，競爭對手只需要 2500 萬美元就能做到，接著再過一年，這個(gè)成本可能又會下降四分之一。那么這種情況下的動(dòng)力在哪里呢？

不僅僅是純粹的基礎(chǔ)模型層面，其他層面可能會有所不同，也許對消費(fèi)者來說會有所變化。今天來看， LLM 的成本優(yōu)勢非常明顯，或許有些問題需要重新審視，但變化不大。

我們會看到這些技術(shù)的進(jìn)一步發(fā)展，未來可能會有其他技術(shù)組件來增強(qiáng)基礎(chǔ)模型的競爭力。如果只看基礎(chǔ)模型，而沒有其他內(nèi)容，我不知道這種模式能有多大的護(hù)城河。

Brett Winton

你認(rèn)為 Meta 之所以能夠進(jìn)入這個(gè)領(lǐng)域，是因?yàn)樵?ChatGPT 推出之前，團(tuán)隊(duì)樂于公開他們的研究成果，他們會說“這是我們的配方，這是我們構(gòu)建它的方法”，有一種公開的精神。即使模型是封閉的，它們也是出于安全原因而封閉的，并且共享了架構(gòu)和方法。

隨著 GPT-4 的推出，情況發(fā)生了變化，現(xiàn)在人們不再愿意公開分享他們的方法。所以，是否有更多的機(jī)會讓團(tuán)隊(duì)之間的性能差異更加明顯，因?yàn)楝F(xiàn)在這些配方不再公開共享了？

Andrew Ng

各個(gè)公司之間的人才流動(dòng)和想法傳播仍然很強(qiáng)烈，因此很難長期保守住秘密。你可能會在短期內(nèi)獲得一些優(yōu)勢，但長期來看，防御性的作用不大。

我看到的情況是，在大科技公司之間的競爭中，尤其是在 AI 和云業(yè)務(wù)方面，確實(shí)可以獲得短期優(yōu)勢，但長期優(yōu)勢我不確定能否持續(xù)。

你提到人們以安全的名義保守秘密，這確實(shí)很有趣。在過去的十年中，每當(dāng)有人說“我的技術(shù)太危險(xiǎn)了，我要保密”時(shí)，通常過了一兩年，類似的技術(shù)就被開源了，而且?guī)淼暮锰庍h(yuǎn)遠(yuǎn)超過了潛在的危害。

我并不是說沒有危害存在，確實(shí)有一些不良分子利用開源技術(shù)，但總體上，每當(dāng)有人說“我的技術(shù)太危險(xiǎn)了”，通常過不了多久就會有開源版本出現(xiàn)，而開源帶來的好處遠(yuǎn)遠(yuǎn)超過了潛在的危害。

以 Llama 3 為例，最初的版本有一個(gè)有限的上下文窗口長度，但因?yàn)樗情_源的，現(xiàn)在開發(fā)者已經(jīng)修改了 Llama 3，擴(kuò)展了它的上下文窗口長度。我們無法在封閉模型中實(shí)現(xiàn)這一點(diǎn)。所以開源創(chuàng)新的力量非常強(qiáng)大。我們現(xiàn)在能夠以非常低的成本提供這種恐懼感，這是開源帶來了大量的創(chuàng)新。

Brett Winton

Llama 開源的商業(yè)邏輯并不神秘。實(shí)際上，我看到 Meta 在開發(fā) PyTorch 時(shí)也采取了類似的策略。Meta 意識到自己需要一個(gè)開源的平臺來構(gòu)建業(yè)務(wù)，而不是依賴于競爭對手的專有平臺，比如 TensorFlow 。

Andrew Ng

是的， Meta 對依賴其他平臺的敏感性并不令人意外。例如，當(dāng) iOS 更改其隱私規(guī)則時(shí)，這會影響 Meta 的業(yè)務(wù)，因?yàn)?iOS 是一個(gè)專有平臺。

當(dāng)我的前團(tuán)隊(duì)在 Google Brain 開發(fā) TensorFlow 時(shí)，我們實(shí)際上雇傭了 Reggie Monger，他是一個(gè)出色的領(lǐng)導(dǎo)者，負(fù)責(zé)開發(fā) TensorFlow 。

Reggie 和我都是出色的工程師，當(dāng)你意識到主流的深度學(xué)習(xí)開發(fā)平臺可能會被競爭對手的專有平臺控制時(shí)， Meta 的做法非常聰明。

Meta 沒有試圖擁有這個(gè)平臺，而是創(chuàng)建了開源的 PyTorch ，隨后它獲得了大量的動(dòng)能，并且大大降低了被其他人控制深度學(xué)習(xí)平臺的風(fēng)險(xiǎn)。

由于 Meta 并沒有運(yùn)營大型云業(yè)務(wù)，因此它只需要一個(gè)開源的平臺來構(gòu)建社交網(wǎng)絡(luò)和通信業(yè)務(wù)。

從商業(yè)角度來看， Meta 確保有一個(gè)開源的基礎(chǔ)模型和生態(tài)系統(tǒng)是非常理性的，因?yàn)檫@樣一來， Meta 就可以在此基礎(chǔ)上進(jìn)行構(gòu)建，而不必?fù)?dān)心依賴于封閉的平臺，比如 iOS 可能在某個(gè)時(shí)候改變規(guī)則。

因?yàn)?Meta 沒有運(yùn)營大型云服務(wù)，所以它沒有動(dòng)機(jī)保持封閉狀態(tài)以銷售 API 調(diào)用?？偟膩碚f，這是一個(gè)非常理性的商業(yè)決策。但這也不影響我們對 Meta 開源這一寶貴舉動(dòng)的感激之情，即使它背后有著非常合理的商業(yè)模式。

Brett Winton

你認(rèn)為對于 AI 應(yīng)用公司來說，比如某家公司如果設(shè)計(jì)的能力水平達(dá)到了 GPT-4 的水平，那么他們其實(shí)可能是在犯一個(gè)大錯(cuò)，因?yàn)槲覀兒芸炀蜁懈鼜?qiáng)大的能力，也許就在今年或明年。

那么，你是否預(yù)見到這樣的戰(zhàn)略格局：OpenAI 推出非常有意義的進(jìn)步，然后其他公司大約六個(gè)月后才跟上？在 AI 應(yīng)用方面，這種技術(shù)進(jìn)步的速度是否會改變你對可能具有商業(yè)化潛力的 AI 應(yīng)用的看法或做法？

Andrew Ng

聽起來這是一個(gè)很好的領(lǐng)導(dǎo)者，自從他還是本科生時(shí)，我就認(rèn)識他了。他當(dāng)時(shí)在我父親的實(shí)驗(yàn)室工作，很久以前的事了。我非常尊重 OpenAI 的一點(diǎn)是，他們在推動(dòng) AI 方面非常積極進(jìn)取。他們確實(shí)很大膽，做出了很多賭注。

當(dāng)你這樣做時(shí)，并不意味著每一個(gè)賭注都會成功，但只需要少數(shù)幾個(gè)成功的賭注，你就可以取得巨大的成果。所以 OpenAI 確實(shí)在做很多不同的事情。

我不想猜測他們所有的計(jì)劃，但我確實(shí)認(rèn)為訓(xùn)練基礎(chǔ)模型是非常重要的，我很期待看到 GPT-5 的發(fā)布，我確信它將比 GPT-4 更強(qiáng)大得多。但我也相信，GPT-5 仍然會有很多事情做不到，很多其他應(yīng)用仍然需要在它之上構(gòu)建。

我的團(tuán)隊(duì)做了一個(gè)小研究，表明在編碼問題上使用 GPT-3.5 與使用 ?Agentic Workflow 的 GPT-4 相比， GPT-3.5 的表現(xiàn)其實(shí)更好。所以雖然從 GPT-3.5 到 GPT-4 的進(jìn)步非常令人興奮，但使用 Agentic Workflow 帶來的改進(jìn)實(shí)際上超過了這個(gè)進(jìn)步。

我非常樂觀地認(rèn)為，不管是 GPT-5 還是 Gemini 2，當(dāng)它們發(fā)布時(shí)，我都很期待它們的表現(xiàn)，但我也相信，現(xiàn)有模型的 Agentic Workflow 和其他創(chuàng)新仍然能在解決非常有價(jià)值的業(yè)務(wù)問題和應(yīng)用問題上走得很遠(yuǎn)。

Charlie Roberts

關(guān)于這個(gè)問題， Andrew ，我記得你多年來對醫(yī)療保健非常感興趣，我相信你家里也有醫(yī)學(xué)背景的人。

Mustafa Suleyman 在他的書《 Becoming Human 》中提到了他對現(xiàn)代圖靈測試的看法，他舉的例子是，如果你能給一個(gè) Agentic 系統(tǒng) 10 萬美元，并讓它生成 100 萬美元的年收入，這將是一個(gè)令人驚嘆的成就，比如它需要去設(shè)立一家公司，編寫營銷計(jì)劃，并開始執(zhí)行這些任務(wù)。

你有沒有想過，無論是在醫(yī)療領(lǐng)域還是其他領(lǐng)域，有沒有一個(gè)現(xiàn)代版的圖靈測試是你希望看到的，可能在不久的將來 Agentic 系統(tǒng)能達(dá)到的目標(biāo)？

Andrew Ng

AI 和人類智能是非常不同的。兩者都非常有價(jià)值，我們總是試圖將 AI 與人類可以做的事情進(jìn)行比較，這沒什么壞處，但，由于人類智能如此獨(dú)特，實(shí)際上很難讓 AI 做所有人類可以做的事情。

當(dāng)然，我們希望 AI 能夠做到，希望我們有生之年能看到這一天的到來，但即使在我們試圖讓 AI 達(dá)到人類水平之前， AI 已經(jīng)能夠在很多領(lǐng)域遠(yuǎn)遠(yuǎn)超越任何一個(gè)活著的人類，這本身就具有巨大的價(jià)值。

所以我更關(guān)注的是一步步的進(jìn)展，這種進(jìn)展正在非常迅速地發(fā)生，這個(gè)進(jìn)展包括 AI 能夠做的事情的范圍，以及各個(gè)行業(yè)的應(yīng)用，而不是僅僅試圖達(dá)到某種類似圖靈測試的標(biāo)準(zhǔn)。當(dāng)然，對于研究人員來說，這樣的測試也是很好的研究方向。

Brett Winton

最終來說，基準(zhǔn)測試有用之處在于它們能夠指示某種可以商業(yè)化并大規(guī)模應(yīng)用的實(shí)際應(yīng)用，這樣才能變得真正有意義和現(xiàn)實(shí)化。而你非常專注于將 AI 帶入市場的實(shí)際應(yīng)用。

你對語言生成之外的應(yīng)用有何看法？你怎么看待語言以外的應(yīng)用，比如機(jī)器人技術(shù)、自動(dòng)駕駛出租車和醫(yī)療領(lǐng)域？你對這些領(lǐng)域的進(jìn)展速度有何期待，你認(rèn)為這些是值得關(guān)注的領(lǐng)域嗎？

Andrew Ng

我們正在朝著那個(gè)方向前進(jìn)。文本革命首先通過 LLM 到來，但我看到圖像處理革命也將隨后到來。我指的不僅僅是生成圖像，而是分析圖像。

比如，LandingAI 正在進(jìn)行關(guān)于大型視覺模型的工作，在未來很短的幾年內(nèi)，我們將在 AI 分析圖像的能力上取得很大進(jìn)展。不僅僅是文本分析，圖像分析也會迅速發(fā)展。

至于應(yīng)用和 AI Fund 所涉及的領(lǐng)域，我們實(shí)際上試圖保持行業(yè)中立。因此，我們重新設(shè)計(jì)了我們的戰(zhàn)略，目的是通過視覺表達(dá) AI 技術(shù)。我們知道 AI 的能與不能，但由于 AI 是一種通用技術(shù)，適用于醫(yī)療保健、金融服務(wù)、物流、教育等多個(gè)領(lǐng)域，我們無法同時(shí)掌握或關(guān)注所有這些領(lǐng)域。

因此，我們在 AI Fund 中的策略是，我們非常喜歡與擁有專業(yè)知識的企業(yè)合作，這些企業(yè)通常是我們的 LP，也可能不是LP。

我們與擁有深厚行業(yè)專業(yè)知識的大型公司合作，這些公司在特定領(lǐng)域有深厚的市場知識和技術(shù)知識，我們通過合作，共同開發(fā)出一些非常獨(dú)特的東西。

我們確實(shí)在醫(yī)療保健領(lǐng)域有所涉足，這是我們的一個(gè)示例。在我們最近的醫(yī)療保健項(xiàng)目中，我們與在某些地理區(qū)域擁有深厚專業(yè)知識的合作伙伴合作，他們不僅在市場和市場進(jìn)入方面有深厚的知識，而且還能與我們的技術(shù)知識相輔相成，讓我們嘗試在美國以外的醫(yī)療保健市場中構(gòu)建一些非常獨(dú)特的東西，因?yàn)槲覀冋J(rèn)為這些市場可能更容易首先攻克。

有趣的是，每當(dāng)我們與大型公司合作并進(jìn)行頭腦風(fēng)暴時(shí)，我們總是會得到比我們或他們能夠?qū)嵤┑南敕ǘ嗟枚嗟膭?chuàng)意。創(chuàng)意的數(shù)量總是讓人既高興又煩惱，因?yàn)樗h(yuǎn)遠(yuǎn)超過了我們能夠動(dòng)用的資源。

Charlie Roberts

從你在 AI Fund 中的經(jīng)驗(yàn)和與大型企業(yè)的對話中，你對 AI 的應(yīng)用和商業(yè)案例有著非常深刻的理解。

在未來五年內(nèi)，你認(rèn)為市場上哪些大問題 AI 可能仍無法解決？反之，哪些大問題可能會因?yàn)?AI 的出現(xiàn)而完全消失，而這些問題是市場或大眾尚未意識到的？

Andrew Ng

這些變化會需要時(shí)間。許多行業(yè)的轉(zhuǎn)型都需要時(shí)間。在深度學(xué)習(xí)和 AI 浪潮中，我們正在做很多工業(yè)自動(dòng)化的重復(fù)性任務(wù)。

眾所周知，物質(zhì)的轉(zhuǎn)移是緩慢的，所以當(dāng)我們處理涉及到現(xiàn)實(shí)世界中物質(zhì)重新配置的事情時(shí)，我們會有所進(jìn)展，但這通常需要時(shí)間。

同樣，當(dāng)涉及到文化變革和內(nèi)部變革管理時(shí)，這種轉(zhuǎn)型也可能出人意料地緩慢。然而，我依然對我們能夠幫助許多企業(yè)重新思考工作流程的速度持樂觀態(tài)度。

雖然在改變物質(zhì)配置時(shí)，這可能是一個(gè)緩慢的過程，但當(dāng)涉及到比特和變革管理流程時(shí)，有時(shí)仍然需要幾年時(shí)間。

所以，盡管我們已經(jīng)大幅度地變革了許多知識型工作，每個(gè)知識型工作今天都可以通過生成式 AI 獲得效率提升，這令人興奮。而我們也將繼續(xù)推動(dòng)這些可能性的發(fā)展。

本文由人人都是產(chǎn)品經(jīng)理作者【江天 Tim】，微信公眾號：【有新Newin】，原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理，未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來自Pexels，基于 CC0 協(xié)議。

更多精彩內(nèi)容，請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App

有新Newin

提供前沿領(lǐng)域商業(yè)洞見與資訊

71篇作品 151450總閱讀量

Keep為小紅書做嫁衣

02-143100 瀏覽

老用戶“坦然放手”：再見，Kindle中國的十年

06-142713 瀏覽

產(chǎn)品想法-需求分析和實(shí)現(xiàn)

11-179101 瀏覽

AI社交，靈感搜集箱（上）

05-164073 瀏覽

將微店生態(tài)帶進(jìn)WhatsApp，拉美泛支付服務(wù)Liquido正式上線

05-061499 瀏覽

評論

目前還沒評論，等你發(fā)揮！

空間計(jì)算時(shí)代，你還需要擔(dān)心 VR 眩暈嗎？

11-132731 瀏覽
進(jìn)擊！GPT-4為營銷人帶來「五個(gè)可能性」

03-162930 瀏覽
旺旺變“大”、一點(diǎn)點(diǎn)變“小”…包裝背后暗藏著哪些營銷小心機(jī)？

05-063312 瀏覽

深度｜吳恩達(dá)最新 Ark Invest 洞察：AI 基礎(chǔ)模型競爭激烈，訓(xùn)練成本每年下降75%，推理下降86%，大廠優(yōu)勢難長期保證

深度｜吳恩達(dá)最新 Ark Invest 洞察：AI 基礎(chǔ)模型競爭激烈，訓(xùn)練成本每年下降75%，推理下降86%，大廠優(yōu)勢難長期保證