
7月7日,在2023世界人工智能大會“生成式AI與大模型:變革與創新”論壇上,啟明創投攜手未盡研究共同發布《生成式AI》報告。
報告顯示,政府對于生成式人工智能的監管反應相當及時,各國也出現了不同的特點。中國在迅速推出生成式人工智能的監管辦法并征求意見的同時,也在鼓勵發展通用人工智能,北京、上海、深圳是最具雄心的第一梯隊,均提出了較具雄心的人工智能科研、創新與產業目標。歐盟繼續在監管和立法方面領先,一如其5年前率先推出GDPR。美國更在意人工智能技術的領先地位,正在形成以風險管理為原則的監管框架。
長期來看,人才對人工智能未來的影響,超過了算力。中國研究人員發布的論文在數量上已經超過了美國,但金字塔頂端,無論是研究還是創業,美國仍然占據明顯的優勢。在全球范圍內,人工智能研究創新的重心正從高校轉移至企業,美國擁有頂尖學者最多的前三大機構,分別是谷歌、微軟與meta,合計招攬了美國頂級學者的30%。中國仍以高校為主,僅阿里巴巴躋身前10。
2022年和2023年,是生成式人工智能技術取得突破的兩年,報告經過梳理論文,發現生成式人工智能領域的一個突出特征,是研究與創新過程的密切結合,許多在企業內部實現,迅速推出用例和產品。這種研究與創業的一體化,初創企業和風險資本起到了重要的作用,而美國科技巨頭和主要人工智能企業的研究投入與人才,包括一些底層技術的研究,這些年來已經超過了大學等研究機構。
有意思的是,報告還對行業未來作出了10大前瞻性預測——
大語言模型方面,2024年中國將出現比肩GPT-4的多語言通用大模型;超長上下文(Long Context)將引領下一次LLM技術突破;在出現更有前景的大語言模型之前,為實現垂直領域更好的效果,以下三種方式將共存:一是在不改變數據分布的情況下,利用更多通用數據進行通用大模型預訓練,不特別引入行業數據,二是利用行業專屬數據微調(Fine-Tuning)通用大模型,三是利用行業數據占比更高的數據集進行垂直模型預訓練。
多模態模型方面,當前CLIP + Diffusion的文生圖模型是過渡態,未來2年內將出現一體化的模型結構;下一代Text-to-Image模型將具備更強的可控性,它將結合底層模型能力和前端控制方式,對模型的設計將注重與控制方式的結合;2025年之前,Video和3D等模態將迎來里程碑式的模型,大幅提高生成效果;以PALM-E為代表的具身智能(Embodied AI)展現出在機器人的感知、理解和決策等方向上的巨大潛力,但當前訓練和可靠性存在較大挑戰;短期內Transformer正成為多個模態的主流網絡結構,但壓縮整個數字世界的通用方法尚未出現,Transformer并不是人工智能技術的終點。
商業機會方面,3年內,顛覆式的AI應用的核心驅動力來自于底層模型的創新,兩者無法解耦,模型的作用將大于產品設計的作用;當前生成式AI市場處于技術主導的早期階段,存在千億美元市值的平臺性企業的機會。