大模型并不是一項(xiàng)“新的技術(shù)”,其所依賴的Transformer架構(gòu)早在2017年就已問世,并以“Attention is All You Need”之名震撼學(xué)術(shù)界。然而,直到2022年底,隨著ChatGPT的推出,大模型才真正成為全民熱議的焦點(diǎn)。為什么這個(gè)革命性架構(gòu)經(jīng)歷了五年時(shí)間才迎來它的巔峰時(shí)刻?是技術(shù)準(zhǔn)備不足,還是我們對(duì)“大模型”的理解發(fā)生了質(zhì)的轉(zhuǎn)變?