精品人妻夜夜爽一区二区_日韩精品中文字幕一区二区三区_亚洲中文字幕精品无人区高潮_亚洲国产AV玩弄放荡女妇系列_精品无人妻一区二区三区

您的位置:首頁(yè) >綜合 > 正文

五千萬(wàn)元只夠看一次煙花!大模型的泡沫大嗎?

來(lái)源:揚(yáng)子晚報(bào)2023-09-30 09:58:29

“做通用大模型,?5000萬(wàn)元只夠看一次‘煙花’,這是一次的訓(xùn)練成本?!?/p>

“現(xiàn)在大模型應(yīng)用的數(shù)量遠(yuǎn)遠(yuǎn)不夠,企業(yè)基本是有很模糊的需求,但又把期望值放得很高?!?/p>

“給做AI應(yīng)用創(chuàng)業(yè)的公司兩個(gè)建議,一是第一筆錢(qián)最好來(lái)自客戶而不是VC(投資人),二是六個(gè)月內(nèi)最好打平你的成本,然后可以賺錢(qián)?!?/p>


(相關(guān)資料圖)

ChatGPT爆紅之后,大模型點(diǎn)燃的人工智能新一輪熱潮還在繼續(xù),近日,OpenAI宣布即將推出能夠理解語(yǔ)音和圖片的新版本ChatGPT,另有消息稱,OpenAI或趕在谷歌發(fā)布Gemini之前推出同為多模態(tài)大模型的GPT-vision,而微軟也推出了全新的Copilot平臺(tái)。

從國(guó)內(nèi)發(fā)展情況來(lái)看,百度創(chuàng)始人李彥宏在9月初稱,億級(jí)參數(shù)的大型語(yǔ)言模型,國(guó)內(nèi)已經(jīng)發(fā)布了超過(guò)70個(gè)。?360創(chuàng)始人周鴻祎更是直言,現(xiàn)在是“百模大戰(zhàn)”,未來(lái)很有可能演化為“萬(wàn)模群舞”。

絕大部分已發(fā)布大模型的企業(yè)認(rèn)為,目前許多行業(yè)的關(guān)鍵環(huán)節(jié)都值得用大模型改造一遍,也有人將大模型比作移動(dòng)時(shí)代的操作系統(tǒng),號(hào)召創(chuàng)業(yè)者們?cè)诖竽P偷幕A(chǔ)上開(kāi)發(fā)出足夠多的AI應(yīng)用。只是與發(fā)布企業(yè)的火熱相比,普通大眾尚未感知到大模型的“魅力”,一些To C端(用戶端)的應(yīng)用在發(fā)布后僅帶來(lái)短暫的熱度。

國(guó)內(nèi)是否需要這么多基礎(chǔ)大模型?當(dāng)互聯(lián)網(wǎng)大廠的大模型還沒(méi)找到清晰的商業(yè)模型,創(chuàng)業(yè)公司的出路在哪里?現(xiàn)階段大模型的火熱有沒(méi)有泡沫?企業(yè)客戶和個(gè)人用戶的使用感受如何?近日,澎湃新聞?dòng)浾卟稍L了多位大模型方面的從業(yè)者、創(chuàng)業(yè)者、使用者試圖尋找答案。

創(chuàng)業(yè)公司更大的機(jī)會(huì)在“中間層”“應(yīng)用層”?

“國(guó)外大模型我們?cè)谟肙pen?AI?的GPT-4,有的客戶會(huì)有私有化部署的要求,所以國(guó)產(chǎn)大模型我們基本也跑了試試,上億級(jí)的模型進(jìn)步很快,但與GPT-3.5還有差距。分類來(lái)看,BAT等大廠自帶場(chǎng)景、數(shù)據(jù),是認(rèn)真在做,創(chuàng)業(yè)公司里智譜AI、MiniMax、百川智能等頭部公司也做的不錯(cuò),拿下了一部分客戶。但業(yè)界確實(shí)有些公司,更多是為了融資造勢(shì),拿了部分垂類的行業(yè)數(shù)據(jù),根據(jù)自己的資金實(shí)力,找一個(gè)開(kāi)源的模型訓(xùn)一下,就說(shuō)自己做了大模型。”基于大語(yǔ)言模型的自動(dòng)化平臺(tái)公司瀾碼科技CEO周健在接受澎湃新聞?dòng)浾卟稍L時(shí)說(shuō)。

周健曾在谷歌、阿里云、弘璣RPA等公司工作,也曾是“AI四小龍”依圖科技的第10號(hào)員工,今年2月,周健創(chuàng)立了瀾碼科技,并與金山辦公等多家上市公司和獨(dú)角獸企業(yè)達(dá)成戰(zhàn)略合作。在周健看來(lái),因?yàn)榇竽P偷摹盎糜X(jué)問(wèn)題”和權(quán)限問(wèn)題,終端用戶或者甲方企業(yè)客戶很難和大模型直接合作,需要像瀾碼科技這樣的中間廠商,這也是創(chuàng)業(yè)公司的機(jī)會(huì)。

在基礎(chǔ)大模型與用戶端需要“中間廠商”,OpenAI的首席執(zhí)行官山姆·奧特曼(Sam?Altman)也曾作出這樣的判斷。奧特曼表示,將來(lái)只會(huì)有一小部分基礎(chǔ)大模型,會(huì)有一批新的創(chuàng)業(yè)公司采用已有的大模型,并對(duì)其進(jìn)行調(diào)整,創(chuàng)造更多價(jià)值,“他們有獨(dú)特的數(shù)據(jù)飛輪,隨著時(shí)間的推移不斷改進(jìn),我認(rèn)為中間那一層會(huì)創(chuàng)造很多價(jià)值?!?/p>

周健告訴澎湃新聞?dòng)浾?,除非大資本支持,大部分創(chuàng)業(yè)公司并不具有做基礎(chǔ)大模型的實(shí)力,因此把目光投向“中間層”或“應(yīng)用層”是更務(wù)實(shí)的做法。

“有家做大模型的企業(yè)曾告訴我,他們之前訓(xùn)練的大模型大概花了兩、三個(gè)億(元),現(xiàn)在算力漲價(jià),新訓(xùn)一個(gè)估計(jì)花費(fèi)要五個(gè)億(元),而大部分創(chuàng)業(yè)公司根本不可能隨手一拍就是5億(元)。我們作為中間層,不需要負(fù)責(zé)大模型智能能力的提升,只是用大模型做產(chǎn)品和商業(yè)化,并不需要大規(guī)模算力,但在拿了數(shù)千萬(wàn)元的A輪融資后,我們還是用了一部分資金購(gòu)買(mǎi)算力。”周健說(shuō)。

國(guó)盛證券報(bào)告在今年2月曾估算,GPT-3訓(xùn)練一次的成本約為140萬(wàn)美元,對(duì)于一些更大的?LLM(大型語(yǔ)言模型),訓(xùn)練成本介于200萬(wàn)美元至1200萬(wàn)美元之間。以ChatGPT在2023年1月的獨(dú)立訪客平均數(shù)1300萬(wàn)計(jì)算,其對(duì)應(yīng)芯片需求為3萬(wàn)多片英偉達(dá)A100 GPU,初始投入成本約為8億美元,每日電費(fèi)在5萬(wàn)美元左右。

創(chuàng)業(yè)公司Zilliz主要提供面向AI應(yīng)用的新一代數(shù)據(jù)庫(kù)技術(shù),幫助企業(yè)開(kāi)發(fā)AI應(yīng)用,并已拿到超6000萬(wàn)美元的B輪融資,該公司觀察到,在過(guò)去幾個(gè)月,各行各業(yè)應(yīng)用大模型都需要將自己企業(yè)內(nèi)部知識(shí)庫(kù)跟大模型整合,而這些需求也是Zilliz發(fā)展壯大的機(jī)會(huì)。

Zilliz技術(shù)合伙人兼首席技術(shù)官欒小凡在接受澎湃新聞?dòng)浾卟稍L時(shí)表示:“說(shuō)得夸張些,可能在十年后,不會(huì)用大模型就和現(xiàn)在不會(huì)用手機(jī)一樣?!睓栊》舱J(rèn)為現(xiàn)在的大模型確實(shí)會(huì)存在成本過(guò)高的問(wèn)題,但他相信隨著技術(shù)發(fā)展,大模型的成本會(huì)越來(lái)越低,行業(yè)內(nèi)態(tài)度也比較樂(lè)觀,“現(xiàn)在的大模型就像是十年前的云計(jì)算,集中式發(fā)展會(huì)帶來(lái)成本下降。”

談及大模型應(yīng)用創(chuàng)業(yè)的現(xiàn)狀,周健直言:“公司很多,但都沒(méi)有做出來(lái)?!?/p>

大模型“有幻覺(jué)”還能應(yīng)用嗎?

“林黛玉三打白骨精、賈寶玉倒拔垂楊柳,大模型開(kāi)的藥方不敢吃,寫(xiě)的律師函也不敢用?!?/p>

大模型的“幻覺(jué)”問(wèn)題(指模型生成不正確、無(wú)意義或不真實(shí)的文本)是大模型要落地應(yīng)用面臨的問(wèn)題之一。有業(yè)內(nèi)人士指出,AI在大部分領(lǐng)域要做到足夠好,達(dá)到甚至超過(guò)人類水平才能產(chǎn)生實(shí)際商業(yè)價(jià)值,也許AI智商從0到70是巨大進(jìn)步,但自己仍不會(huì)為它付費(fèi),“就像水必須燒到100度才能驅(qū)動(dòng)蒸汽機(jī),你99度的水就不行。”

欒小凡也向澎湃新聞?dòng)浾咛寡?,大模型?yīng)用的運(yùn)作建立在概率之上,可以通過(guò)大量參數(shù)的導(dǎo)入不斷提高正確率,但也只能無(wú)限接近于100%,和計(jì)算機(jī)程序原有的運(yùn)行原理相比,更像是人類的思考方式。正因如此,大模型應(yīng)用適合被用來(lái)進(jìn)行輔助工作,最終還是需要人來(lái)做判斷。

值得關(guān)注的是,9月12日,為了進(jìn)一步推動(dòng)人工智能應(yīng)用的落地和創(chuàng)新,工業(yè)和信息化部工業(yè)文化發(fā)展中心在北京召開(kāi)AI應(yīng)用工作組籌備會(huì),并正式成立AI應(yīng)用工作組。

AI應(yīng)用工作組執(zhí)行組長(zhǎng)、行行AI董事長(zhǎng)李明順在接受澎湃新聞?dòng)浾卟稍L時(shí)表示:“大模型不是技術(shù)創(chuàng)新,也不是技術(shù)革命,它只是一個(gè)技術(shù)的發(fā)現(xiàn)。這個(gè)技術(shù)一旦眾所周知后,拼的是數(shù)據(jù)能力、算力投入,本質(zhì)上是錢(qián)的問(wèn)題。所以,我們看到許多起初做基礎(chǔ)大模型的創(chuàng)業(yè)公司,現(xiàn)在慢慢轉(zhuǎn)了方向,在找垂直場(chǎng)景做應(yīng)用?!?/p>

李明順表示,大模型別怕有“幻覺(jué)”,AI應(yīng)用落地是循序漸進(jìn)的,哪怕是嚴(yán)肅的場(chǎng)景,也可以先把一些可能產(chǎn)生“幻覺(jué)”的場(chǎng)景給B端專業(yè)人士使用,做輔助決策,然后再推向C端,“比如,把大模型用在醫(yī)療上,它的回答可能不那么專業(yè),但這不影響把大模型應(yīng)用給年輕的醫(yī)生做輔助決策。大家還是要找準(zhǔn)大模型應(yīng)用的方向,你可以利用AI操控電風(fēng)扇,但你不能依靠它問(wèn)股票漲不漲,哪只股票會(huì)漲,這本身就不理性?!?/p>

周健也向澎湃新聞?dòng)浾弑硎荆蒎e(cuò)度高的領(lǐng)域更適合做大模型,“審核、合規(guī)、支付這些容錯(cuò)度低的,利用大模型就要謹(jǐn)慎?!?/p>

大模型是否有泡沫?

大模型很熱,其中有沒(méi)有“泡沫”?是否需要這么多大模型?

多位從業(yè)人士在澎湃新聞?dòng)浾叩牟稍L中表示有泡沫,所謂“百模大戰(zhàn)”“萬(wàn)模群舞”,在業(yè)內(nèi)人士看來(lái)最終需要的大模型可能只在個(gè)位數(shù)。

“當(dāng)然有泡沫,上游產(chǎn)能需求暴增,英偉達(dá)的芯片只能加價(jià)買(mǎi),價(jià)格漲了50%-60%,反過(guò)來(lái)說(shuō),如果沒(méi)有這么多公司想要做大語(yǔ)言模型,算力不該那么緊張?!敝芙≌f(shuō)。

欒小凡也坦言,大模型可能正處于泡沫的頂點(diǎn),“一段時(shí)間后大家的熱情會(huì)下降,然后再到下一步的研究,要經(jīng)過(guò)一個(gè)過(guò)程?!?/p>

李明順則判斷,底座大模型可能只需要幾家,數(shù)量不超過(guò)5個(gè)。

目前,B端和C端對(duì)大模型應(yīng)用的使用感受如何?人們什么時(shí)候能夠普遍感受到大模型應(yīng)用的價(jià)值?

在B端,中小型企業(yè)魯邦通云與數(shù)字化服務(wù)中心CTO楚寧志向澎湃新聞?dòng)浾弑硎?,若采用云的模式?lái)按需使用大模型,成本并不高,先低成本的驗(yàn)證,再考慮私有化部署,但建議中小企業(yè)要有一個(gè)理解大模型并嘗試使用大模型支持企業(yè)業(yè)務(wù)的過(guò)程。

楚寧志告訴記者,該公司已經(jīng)“嘗鮮”了國(guó)內(nèi)一家互聯(lián)網(wǎng)大廠的大模型,應(yīng)用方向包括設(shè)備AI智能巡檢、預(yù)測(cè)性維護(hù),以及醫(yī)療物聯(lián)網(wǎng)產(chǎn)品的健康體征分析報(bào)告。“就現(xiàn)狀而言,大模型應(yīng)用落地的挑戰(zhàn)還是在于數(shù)據(jù)本身,缺乏有效的數(shù)據(jù)積累,對(duì)于中小企業(yè)而言,是一個(gè)大問(wèn)題,這需要國(guó)家政策、標(biāo)準(zhǔn)和法規(guī)的支持和引導(dǎo)?!背幹菊f(shuō)。

在C端,一位前互聯(lián)網(wǎng)大廠的資深創(chuàng)意負(fù)責(zé)人、AI驅(qū)動(dòng)的創(chuàng)意公司zax創(chuàng)始人趙晨已將ChatGPT、Stable Diffusion等工具熟練地應(yīng)用在其工作中。趙晨告訴澎湃新聞?dòng)浾?,AIGC(生成式人工智能)已改變他的工作流,“AIGC生產(chǎn)的DEMO基本接近終稿的七八成且速度快,人來(lái)畫(huà)需要三四天,用AIGC基本半小時(shí)可以完成,只是沒(méi)有那么精細(xì)。另外,我也節(jié)約了成本,客戶最終買(mǎi)的只是‘一稿’,但在最終定稿前,會(huì)過(guò)好幾版,如果沒(méi)有AI,我要多找?guī)讉€(gè)插畫(huà)師,每幅畫(huà)都要付出成本,這很貴?!?/p>

“我認(rèn)為,未來(lái)替代你的不是AI,而是會(huì)用AI的人。”趙晨告訴澎湃新聞?dòng)浾?,使用AIGC工具在技巧方面有一定門(mén)檻,在廣告創(chuàng)意領(lǐng)域,AIGC工具還遠(yuǎn)遠(yuǎn)沒(méi)有普及。

東方證券在研報(bào)中指出,大模型企業(yè)在獲得備案和向公眾開(kāi)放后,各類C端應(yīng)用將從過(guò)去的邀請(qǐng)制、限制名額的注冊(cè)制,進(jìn)入到全面推廣期,這將對(duì)各類基于大模型的應(yīng)用推廣打下更好基礎(chǔ)。B端應(yīng)用方面,大模型與企業(yè)知識(shí)庫(kù)、工作流的結(jié)合,具備較好的粘性和應(yīng)用空間,未來(lái)大模型+流程、大模型+知識(shí)庫(kù)、大模型+低代碼均具備較好的落地空間。

天風(fēng)證券則指出,下半年開(kāi)始海外巨頭應(yīng)用和模型迭代速度提升明顯,預(yù)計(jì)海外巨頭相關(guān)AI事件和AI產(chǎn)品迭代,或?qū)⑷缤习肽闓PT4發(fā)布一樣成為持續(xù)催化AI行情的重要事件,而現(xiàn)階段Copilot發(fā)布和Adobe AI產(chǎn)品開(kāi)啟定價(jià)僅是AI應(yīng)用落地趨勢(shì)的開(kāi)始,預(yù)計(jì)會(huì)有更多AI應(yīng)用有望隨著大模型技術(shù)升級(jí)不斷涌現(xiàn)。

關(guān)鍵詞:

最近更新