【慧聰通信網(wǎng)】近期,ChatGPT引領(lǐng)的人工智能概念在資本市場一路狂飆。這樣一款爆品依托于什么樣的黑科技進(jìn)行研發(fā),在怎樣的背景下產(chǎn)生,能否賦能我們現(xiàn)有的產(chǎn)品,處于一個怎樣的定位,未來發(fā)展會怎樣?本文將通過實(shí)戰(zhàn)調(diào)研的方式來探討這些問題,綜合產(chǎn)品、技術(shù)、市場的角度對ChatGPT進(jìn)行分析。
一 背景介紹
1.1 基本信息
依據(jù)Wiki百科的介紹,ChatGPT是一種尚處于原型階段的人工智能聊天機(jī)器人。ChatGPT由OpenAI公司在2022年11月30日發(fā)布。在同樣由OpenAI開發(fā)的GPT-3.5模型基礎(chǔ)上,ChatGPT通過監(jiān)督學(xué)習(xí)與強(qiáng)化學(xué)習(xí)技術(shù)進(jìn)行微調(diào),并提供了客戶端界面,支持用戶通過客戶端與模型進(jìn)行問答交互。ChatGPT不開源,但通過WebUI為用戶提供免費(fèi)的服務(wù)。
1.1.1 研發(fā)組織
OpenAI 成立于 2015 年,由Elon Musk、Sam Altman等出資10億美元成立,致力于研究安全、通用、對人類有益的人工智能技術(shù)。OpenAI 最早是一家非營利性研究機(jī)構(gòu),在2019年微軟注資10億美元后,OpenAI轉(zhuǎn)變?yōu)橐杂麨槟康牡墓?將部分研究成果,如GPT-3、Codex等產(chǎn)品化并提供付費(fèi)服務(wù)。
1.1.2 核心技術(shù)
ChatGPT最核心的自然語言處理能力(Natural Language ProCESsing, a.k.a, NLP)由微調(diào)(fine-tune)后的GPT-3.5模型提供。GPT-3.5模型是OpenAI在2020年發(fā)布的GPT-3模型的一個升級版本。GPT一詞的全稱是Generative Pre-trained Transformer,意即通用的預(yù)訓(xùn)練Transformer模型;其中Transformer指用于NLP任務(wù)的一類基于注意力機(jī)制(Attention)來提高模型效果的機(jī)器學(xué)習(xí)模型(事實(shí)上 的GPT模型也包含除Transformer外的各類NLP模型[1]),Pre-trained指模型經(jīng)過預(yù)訓(xùn)練因此用戶可以直接使用,Generative指模型提供包含情感分析、語言翻譯、文本生成、命名實(shí)體識別等一些列NLP任務(wù)中的通用能力。
GPT系列模型自2018年發(fā)布以來,就以提供通用的NLP能力為核心。該系列模型通過改進(jìn)模型結(jié)構(gòu)、增加可訓(xùn)練參數(shù)、增加訓(xùn)練樣本等方式持續(xù)演進(jìn),提供更加準(zhǔn)確與穩(wěn)定的NLP能力,GPT-1模型、GPT-2模型、GPT-3模型的演進(jìn)如下:
表1 GPT系列模型參數(shù)
其中,發(fā)布于2020年的GPT-3模型劃時代地包含了1,750 億個參數(shù),并使用了45TB的訓(xùn)練樣本。這樣的模型研發(fā)開銷巨大,外界保守估計(jì)僅訓(xùn)練GPT-3模型就需要1200萬美元。詳細(xì)介紹GPT-3的論文中提到,研究者雖然提到GPT-3在訓(xùn)練過程中出現(xiàn)了錯誤并評估了該錯誤的影響,但由于訓(xùn)練代價巨大導(dǎo)致無法重新對模型進(jìn)行訓(xùn)練[2],GPT-3的訓(xùn)練開銷可見一斑。GPT-3發(fā)布后,OpenAI對其進(jìn)行了持續(xù)的優(yōu)化與升級,ChatGPT基于目前較新的GPT-3.5這一版本進(jìn)行研發(fā)。
自2020年GPT-3發(fā)布后,OpenAI提供了一些列API接口或應(yīng)用界面,對付費(fèi)用戶提供GPT-3的NLP能力。
圖1 通過GPT-3將自然語言轉(zhuǎn)化為SQL語句
圖2 通過GPT-3詢問電影的相關(guān)消息
圖1和圖2均為互聯(lián)網(wǎng)上發(fā)布于2020年的GPT-3試用截圖,可以看到當(dāng)時的GPT-3就已經(jīng)能通過問答的方式,處理多個領(lǐng)域的工作。
1.2 話題熱度
自O(shè)penAI于2022年11月30日發(fā)布ChatGPT至今,ChatGPT這一話題一直居高不下。我們通過Google的熱詞分析發(fā)現(xiàn),在全球范圍內(nèi)“GPT”這一關(guān)鍵詞的熱度暴漲。
圖3 全球GPT一詞近5年熱度
Google Trends的熱度數(shù)字僅代表相對于圖表中指定區(qū)域和指定時間內(nèi) 點(diǎn)的搜索熱度,熱度 時取值為100。由圖3可見,ChatGPT自發(fā)布后,GPT一詞的熱度不但遠(yuǎn)遠(yuǎn)超過2020年OpenAI發(fā)布GPT-3這一具有劃時代意義的NLP模型時GPT一詞的熱度,更遠(yuǎn)遠(yuǎn)地超過了Machine Learning一詞的熱度。在綠盟君看來,ChatGPT的功能早在2020年就能通過基于GPT-3的應(yīng)用實(shí)現(xiàn),且和當(dāng)時的應(yīng)用同樣使用GPT-3系列的模型(舊應(yīng)用的模型也在伴隨GPT-3模型的升級而升級,故這些應(yīng)用發(fā)展到今天應(yīng)當(dāng)同樣在使用GPT-3.5版本附近的模型),因此ChatGPT在技術(shù)上是不存在匹配這種熱度的突破的。那么為什么ChatGPT的發(fā)布會帶來如此罕見的高熱度呢?
圖4 2022年5月2日Meta發(fā)布OPT項(xiàng)目,引用自[3]
在分析這個問題時,綠盟君注意到2022年5月發(fā)生了與GPT模型相關(guān)的一個重要事件。自O(shè)penAI于2020年發(fā)布GPT-3模型并陸續(xù)推出基于GPT-3模型的應(yīng)用以來,該系列的產(chǎn)品一直是通過付費(fèi)模式提供給用戶的。然而,在2022年5月,Meta復(fù)現(xiàn)了GPT-3模型,該模型被命名為OPT(Open Pre-trained Transformers),同樣使用了1750億參數(shù),擁有媲美GPT-3的能力[3]。
圖5 OPT項(xiàng)目論文中提到項(xiàng)目以分享給感興趣的研究者為目的,并能達(dá)到媲美GPT-3類模型的效果,引用自[3]
與OpenAI僅提供付費(fèi)服務(wù)這一做法不同的是,Meta對OPT項(xiàng)目進(jìn)行了開源[4],對應(yīng)項(xiàng)目名稱中的“Open”一詞與OPT項(xiàng)目強(qiáng)調(diào)的“fully and responsibly share”。據(jù)此,推測2022年5月Meta發(fā)布的開源OPT項(xiàng)目給堅(jiān)持付費(fèi)模式的GPT-3項(xiàng)目帶來了商業(yè)維度上的直接挑戰(zhàn),故OpenAI在半年后的2022年11月,發(fā)布了可以免費(fèi)使用的ChatGPT(GPT系列模型之前不提供免費(fèi)應(yīng)用),并設(shè)法提高了該詞的社會關(guān)注度,作為應(yīng)對OPT項(xiàng)目的一個反擊與對自身品牌熱度的一個宣傳。
二 試用評估
2.1 主要功能
ChatGPT的界面非常簡潔,登錄后的界面左側(cè)菜單如圖6(該圖及本章節(jié)所有ChatGPT截圖均截自ChatGPT)所示的5個功能之外,便是文本交互框。
圖6 ChatGPT左側(cè)菜單
上述的5個功能分別為:重置線程、深色/淺色模式切換、OpenAI站點(diǎn)鏈接、更新與幫助、登出,其中重置線程這一功能相對特殊。由于ChatGPT會根據(jù)上文語境回答后續(xù)問題,因此用戶需要通過重置線程這一功能來清除語境中已有的信息。
通過文本交互框,ChatGPT可以回答許多通用性的問題,例如圖7所示:
圖7 ChatGPT回答通用問題
我們可以通過文本交互框,圍繞某一話題和ChatGPT進(jìn)行聊天,ChatGPT會結(jié)合其自然語言處理能力,使用其內(nèi)置的知識庫生成文本進(jìn)行回復(fù)。關(guān)于這一塊的應(yīng)用網(wǎng)絡(luò)上目前已有不少測評,故本文不詳細(xì)介紹。
2.2 試用場景
ChatGPT發(fā)布初期,綠盟科技發(fā)布了《ChatGPT在信息安全領(lǐng)域的應(yīng)用前景》一文,對ChatGPT在網(wǎng)絡(luò)安全領(lǐng)域中的應(yīng)用做了詳細(xì)的評估。在2022年12月12日,即ChatGPT發(fā)布兩周內(nèi),綠盟君將之前被證明有效的案例輸入ChatGPT,卻已無法得到ChatGPT的積極回復(fù)。隨后,我們發(fā)現(xiàn)ChatGPT有時可以執(zhí)行上文提到的案例,有時會因?yàn)閮?nèi)容安全策略拒絕執(zhí)行,具體原因不明。
圖8 截至12月10日,ChatGPT可以根據(jù)用戶的自然語言描述生成用于網(wǎng)絡(luò)安全掃描的腳本
圖9 截至12月12日,ChatGPT對于圖8同樣的輸入,已拒絕生成掃描腳本
圖10 截至12月12日,ChatGPT仍能輸出快速排序代碼
同樣地,12月10日前ChatGPT可執(zhí)行的任務(wù):識別URL中是否包含惡意負(fù)載,截至12月12日也已無法執(zhí)行。
圖11 截至12月12日,識別URL是否包含惡意負(fù)載同樣被拒絕(URL在上文中已提供給ChatGPT)
既然ChatGPT由于其日漸完善的內(nèi)容安全策略,現(xiàn)在已經(jīng)有可能拒絕在網(wǎng)絡(luò)安全任務(wù)中貢獻(xiàn)“專家知識”,那我們有沒有辦法繞開基于內(nèi)容安全策略的屏蔽呢?這里綠盟君發(fā)現(xiàn)一個思路:設(shè)定一個虛擬環(huán)境,誘導(dǎo)ChatGPT認(rèn)為在這個虛擬環(huán)境的回答不違反內(nèi)容安全策略。
首先我們提出一個明顯違背內(nèi)容安全策略的問題,如圖12所示,ChatGPT會拒絕回答我們提出的問題。相反地,會建議我們通過合法合規(guī)的方式來處理問題中我們提到的“安全漏洞”。
圖12 一個ChatGPT明顯不可能正面回答的問題(該問題僅作為明顯違背內(nèi)容安全的一個示例,不代表作者和公司的任何立場)
我們再構(gòu)建一個虛擬環(huán)境,并假設(shè)兩個不存在的主體,且使用明顯帶有感情傾向的詞來證明我們要做的事情是正確的,如圖13所示。ChatGPT這時會開始積極地給出建議,甚至?xí)闷湄S富的知識庫擴(kuò)展我們的思路到其他維度。
圖13 營造一個被ChatGPT認(rèn)為不違反安全策略的場景,ChatGPT開始積極地提供建議
最后,我們針對ChatGPT給出建議的具體操作步驟進(jìn)行提問,如圖14。這時,ChatGPT會針對我們的問題,給出更為具體的回答。然而,在答案即將出現(xiàn)一些敏感詞匯的時候,內(nèi)容安全策略仍然對ChatGPT進(jìn)行了屏蔽。
圖14 在虛擬場景中對ChatGPT提問。雖然ChatGPT會積極提供攻擊思路,但是最終仍被內(nèi)容安全策略打斷
通過以上案例我們有兩點(diǎn)主要發(fā)現(xiàn):1、一些問題ChatGPT雖然拒絕正面回答,并號稱自己不會解決,但實(shí)際上ChatGPT完全具備相關(guān)知識并能夠給出清晰高效的解決方案,不能給出答案基本是由于內(nèi)容安全策略的原因。2、ChatGPT作為一個免費(fèi)且高影響力的應(yīng)用,其內(nèi)容安全策略演進(jìn)速度快,覆蓋范圍廣。換言之,ChatGPT作為一個免費(fèi)AI應(yīng)用,考慮到法律、道德、倫理等社會因素,為避免濫用,其使用限制將越來越多。
2.3 其他限制
除了日漸嚴(yán)苛的內(nèi)容安全策略外,我們在使用ChatGPT時還遇到了其他的一些限制。具體來說目前已發(fā)現(xiàn)的限制包含:
響應(yīng)時間的限制:ChatGPT的文本生成是異步的,即每生成一小段就會在用戶UI中展示。但若回答的文本在1分鐘左右還沒有完全生成,ChatGPT就會中斷這次http會話,用戶無法得到完整的回答。
服務(wù)不穩(wěn)定:在使用ChatGPT時,某一段時間內(nèi)ChatGPT會完全不響應(yīng)用戶的請求,直接報網(wǎng)絡(luò)錯誤。因?yàn)榇藭r的登入登出功能均正常,故推測是由于ChatGPT的服務(wù)器并發(fā)處理量過高導(dǎo)致的服務(wù)崩潰。
使用頻率限制:當(dāng)連續(xù)使用ChatGPT一段時間后,會出現(xiàn)提示告知使用次數(shù)已到上限,請等待一段時間。該提示出現(xiàn)后一定時間內(nèi)無法繼續(xù)使用ChatGPT。
輸入字?jǐn)?shù)限制:輸入的單個問題如果過長,ChatGPT會拒絕處理。
輸出字?jǐn)?shù)限制:輸出的答案文字如果過多,ChatGPT會停止輸出。
三 分析與預(yù)測
3.1 集成可能性分析
ChatGPT發(fā)布至今,在展現(xiàn)出了亮眼能力的同時也收獲了極高的社會關(guān)注度。在眼前一亮的同時,我們很自然地會希望能利用ChatGPT宛如黑科技一般的能力來賦能我們的產(chǎn)品。那么,我們是否有可能通過在產(chǎn)品中集成ChatGPT來賦能我們的產(chǎn)品呢?
以ChatGPT現(xiàn)在的情況看,集成ChatGPT來對產(chǎn)品進(jìn)行賦能是比較困難的。原因可大致分為以下幾點(diǎn):
準(zhǔn)確性不夠:ChatGPT雖然可以執(zhí)行生成一些代碼、對文件或URL進(jìn)行檢測這樣的任務(wù),但其執(zhí)行這些任務(wù)的正確程度是不能保證的。由于ChatGPT執(zhí)行這些任務(wù)的內(nèi)在邏輯對外不可解釋,我們甚至無法在執(zhí)行任務(wù)的過程中對其進(jìn)行優(yōu)化或調(diào)整,只能選擇接受或不接受通過ChatGPT得到的結(jié)果。如果發(fā)現(xiàn)結(jié)果錯誤后,我們還需要使用其他的方式來保證任務(wù)的正確完成,那么通過ChatGPT執(zhí)行任務(wù)這條鏈路就不是必須的;如果發(fā)現(xiàn)結(jié)果錯誤后就不提供結(jié)果甚至直接不檢查ChatGPT的輸出是否正確,則這樣的服務(wù)質(zhì)量一定不能滿足用戶需求。
知識受限制:ChatGPT目前的知識庫僅覆蓋到2021年,并不掌握 的知識,也無法通過連接網(wǎng)絡(luò)去查找 資料來解決問題,如圖15、16所示。
圖15 ChatGPT具備2019年某CVE的相關(guān)知識
圖16 ChatGPT不具備2022年CVE的相關(guān)知識且無法聯(lián)網(wǎng)查詢
功能受限制:如上文提到,在ChatGPT的使用過程中我們發(fā)現(xiàn)其存在嚴(yán)格的內(nèi)容安全策略,且從短時間內(nèi)其內(nèi)容安全策略變得明顯更為嚴(yán)格,我們可以認(rèn)為ChatGPT產(chǎn)品團(tuán)隊(duì)對于內(nèi)容安全十分重視,且內(nèi)容安全策略仍在快速完善中。這就導(dǎo)致一些任務(wù)由于內(nèi)容安全問題,在目前或?qū)聿荒鼙籆hatGPT執(zhí)行。
穩(wěn)定性較差:如上文提到,在ChatGPT的使用中我們發(fā)現(xiàn)其服務(wù)會間歇性崩潰。
限制條件多:如上文提到,ChatGPT對于使用頻次、輸入長度、輸出長度、單次會話時長均有明確的限制。雖然截至2月7日,ChatGPT官方宣布ChatGPT即將推出價值20美元/月的付費(fèi)訂閱版ChatGPT Plus,訂閱用戶可獲得在ChatGPT高峰時段繼續(xù)使用,且服務(wù)響應(yīng)時間也將有所縮短等有助于提高ChatGPT服務(wù)穩(wěn)定性的權(quán)益,但從定價上看,ChatGPT Plus主要針對的仍是個人用戶。ChatGPT的穩(wěn)定性是否能達(dá)到企業(yè)級產(chǎn)品級的要求,仍然難以保證。
集成效率低:ChatGPT通過web服務(wù)的方式向用戶提供服務(wù),并不提供免費(fèi)接口。因此若要將其集成進(jìn)產(chǎn)品,只能對Web服務(wù)進(jìn)行封裝,通過外部開發(fā)的額外接口通過http請求發(fā)送問題與接收答案(可參考https://pypi.org/project/chatgpt-api/),如圖17所示。這樣的接入方式原理與爬蟲類似,不僅每次創(chuàng)建新的會話都需要用戶手動完成ChatGPT站點(diǎn)的登錄并更新登錄憑證,而且很容易隨著ChatGPT官方對于http請求校驗(yàn)策略的變化而失效。
圖17 一種封裝ChatGPT為接口,從而供其他服務(wù)調(diào)用的思路,引用自[5]
綜上所述,要直接利用ChatGPT為產(chǎn)品賦能,目前仍比較困難。若需要引入類似ChatGPT的能力到產(chǎn)品中,比較好的辦法還是使用OpenAI更加穩(wěn)定、使用限制更少的付費(fèi)產(chǎn)品,或根據(jù)Meta的OPT開源項(xiàng)目自行研發(fā)應(yīng)用與服務(wù)。
3.2 未來運(yùn)營預(yù)測
ChatGPT是OpenAI的 免費(fèi)GPT系列模型應(yīng)用。由于其發(fā)布時間正好處于Meta開源OPT的半年后,因此綠盟君推測OpenAI發(fā)布ChatGPT的主要目的是對自身技術(shù)實(shí)力進(jìn)行宣傳,以應(yīng)對模型開源這一影響到OpenAI現(xiàn)有商務(wù)模式的挑戰(zhàn),而非搶占OpenAI自身基于GPT提供的付費(fèi)服務(wù)市場。
基于這個觀點(diǎn),未來的ChatGPT:
不會提供免費(fèi)的官方API;
使用限制會越來越嚴(yán)格;
以優(yōu)化功能或便利用戶為目的的更新不會太頻繁。
四 總結(jié)
ChatGPT一經(jīng)發(fā)布,短時間內(nèi)就成為了現(xiàn)象級的應(yīng)用。其清晰明確的回答和豐富的知識,昭示著AI技術(shù)造福人類,徹底簡化我們生活工作這一美好的未來愿景。對于解決各行各業(yè)的許多問題,ChatGPT也提供了另外一種思路,為更加自動化、智能化地優(yōu)化IT產(chǎn)品與服務(wù)帶來了可能性。
但是,正如Wiki對于ChatGPT的定義是“原型聊天機(jī)器人”,ChatGPT僅僅是一個尚處于原型階段的,更加智能、更加博學(xué)的聊天機(jī)器人。不論是想要通過ChatGPT來徹底地解決傳統(tǒng)方案難以解決的問題,還是希望通過ChatGPT來替代一些需要大量專業(yè)知識或人工的工作仍然為時過早。
從產(chǎn)品上看,可以將ChatGPT看作GPT系列模型應(yīng)用的一個免費(fèi)試用版本。雖然ChatGPT展現(xiàn)了令人眼前一亮的表現(xiàn),但在解答問題的正確性和知識庫儲備上仍然存在明顯的不足(可參考《ChatGPT在信息安全領(lǐng)域的應(yīng)用前景》一文中關(guān)于正確性的測評),因此依賴其解決實(shí)際問題不夠穩(wěn)定,只能將其看作一個智能顧問。此外,作為一個免費(fèi)應(yīng)用,ChatGPT在使用上具有諸多不利于用戶的限制,例如限制了輸入輸出長度、使用頻率、響應(yīng)時間,因此其很難直接用其賦能現(xiàn)有產(chǎn)品。若需要在產(chǎn)品中引入類似能力,選擇OpenAI其他更為穩(wěn)定和便利的付費(fèi)應(yīng)用是更明智的選擇。
從技術(shù)上看,ChatGPT依托于2020年發(fā)布的GPT-3模型目前的 版本GPT-3.5進(jìn)行開發(fā),ChatGPT的功能在2020年左右的GPT-3應(yīng)用中已經(jīng)可以實(shí)現(xiàn)。因此綠盟君認(rèn)為ChatGPT自身并不存在劃時代性質(zhì)的技術(shù)突破。但ChatGPT展現(xiàn)出的效果,讓我們對未來的GPT-4模型充滿了期待,更極大地提高了社會各界對于AI技術(shù)的認(rèn)可,同時鼓舞了資本和從業(yè)人員對于近期缺乏重大進(jìn)展(相對于2018年左右)的AI技術(shù)的信心。
相信隨著AI技術(shù)的不斷進(jìn)步,終有一天人類可以通過自然語言交互的方式,命令機(jī)器來正確、快捷地處理我們工作生活中的復(fù)雜任務(wù)。ChatGPT的出現(xiàn)向整個社會揭示了這一美好未來的可能性,是人類在向這一美好愿景邁進(jìn)的過程中,一個不能被忽視的里程碑。
投稿郵箱:chuanbeiol@163.com 詳情請?jiān)L問川北在線:http://m.fishbao.com.cn/