首頁 新聞中心 時政 獨家 縣區(qū) 小記者 教育 醫(yī)療健康 美食 金融 旅游 冰雪網(wǎng) 數(shù)字報刊
您當(dāng)前的位置:首頁 > 新聞中心 > 即時新聞

“鏈氪”探鏈丨數(shù)字詩人李白是怎么誕生的?

2024-11-27 13:26:20  來源:央視新聞客戶端

第二屆中國國際供應(yīng)鏈促進博覽會11月26日在北京正式開幕。鏈博會吉祥物“鏈氪”來到數(shù)字科技展區(qū),遇到了一位神秘人物↓↓↓

04:29

總臺央視記者 張道峰數(shù)字詩人李白是由人工智能大模型生成的,也就是我們常說的生成式人工智能,而做出這一大模型的是一家成立還不到一年的人工智能創(chuàng)新中心。

廉士國是創(chuàng)新中心首席人工智能科學(xué)家,他給我們現(xiàn)場拆解了人工智能大模型的運作過程。

生成一個數(shù)字詩人李白要分三步:先由文字生成圖片,圖片生成視頻,文字再生成語音跟視頻進行融合。不過,看似簡單的三步,做起來卻不容易。

中國聯(lián)通人工智能創(chuàng)新中心首席AI科學(xué)家兼技術(shù)總師 廉士國首先要訓(xùn)練一個語言模型,它大概需要40TB的數(shù)據(jù),這個數(shù)據(jù)量大概相當(dāng)于400萬本電子書的數(shù)據(jù)量。

有了語言模型的基礎(chǔ),才能繼續(xù)訓(xùn)練文生圖、文生視頻等多模態(tài)大模型,背后還需要大量“數(shù)據(jù)對”,也就是數(shù)據(jù)之間的聯(lián)系,比如文字和圖片對應(yīng)的數(shù)據(jù),圖片和視頻對應(yīng)的數(shù)據(jù)等。

中國聯(lián)通人工智能創(chuàng)新中心首席AI科學(xué)家兼技術(shù)總師 廉士國:大概需要10億對文字圖像對,從圖像再到視頻,大概在百億對的級別。

不過,有了海量數(shù)據(jù)才是第一關(guān),然后是“數(shù)據(jù)標(biāo)注”,就是要把數(shù)據(jù)轉(zhuǎn)化為機器學(xué)習(xí)算法能理解的形式。

總臺央視記者 張道峰:想什么就能設(shè)計出什么,看似簡單的過程,背后其實是一條全新而龐大的人工智能產(chǎn)業(yè)鏈在支撐。數(shù)字詩人李白能夠作詩,算法、數(shù)據(jù)等等這條鏈的每一個環(huán)節(jié)都在發(fā)揮作用。

算法、數(shù)據(jù)、算力的高效協(xié)同,構(gòu)成了生成式人工智能快速發(fā)展的重要鏈條?,F(xiàn)在,大模型技術(shù)賦能千行百業(yè),像“李白作詩”這樣的“文物活化”技術(shù)正在走進我們的生活。


編輯:雷偉
河山新聞
移動客戶端
張家口日報官方
微信“張小全兒”
張家口新聞網(wǎng)
官方微博
抖音掃碼
關(guān)注@張家口NEWS
【張家口新聞網(wǎng)版權(quán)聲明 】

1.本網(wǎng)(張家口新聞網(wǎng))稿件下“稿件來源”項標(biāo)注為“張家口新聞網(wǎng)”、“張家口日報”、“張家口晚報”的,根據(jù)協(xié)議,其文字、圖片、音頻、視頻稿件之網(wǎng)絡(luò)版權(quán)均屬張家口新聞網(wǎng)所有,任何媒體、網(wǎng)站或個人 未經(jīng)本網(wǎng)協(xié)議授權(quán),不得轉(zhuǎn)載、鏈接、轉(zhuǎn)貼或以其他方式復(fù)制發(fā)表。已經(jīng)本網(wǎng)協(xié)議授權(quán)的媒體、網(wǎng)站,在下載使用 時須注明“稿件來源:張家口新聞網(wǎng)”,違者本網(wǎng)將依法追究責(zé)任。

2.本網(wǎng)其他轉(zhuǎn)載稿件涉及版權(quán)等問題,請作者或版權(quán)所有者在一周內(nèi)來電或來函。聯(lián)系電話:0313-2051987。