国产成人精品a有声小说,在线观看亚洲网站,91最新地址永久入口,欧美精品国产第一区二区

            中國西藏網(wǎng) > 即時(shí)新聞 > 博覽

            彭博針對金融業(yè)推出大型語(yǔ)言模型BloombergGPT

            發(fā)布時(shí)間:2023-04-03 09:03:00來(lái)源: 中國新聞網(wǎng)

              中新網(wǎng)3月31日電 3月30日,彭博發(fā)布公告稱(chēng),推出為金融界打造的大型語(yǔ)言模型(LLM)——BloombergGPT。

              

              圖片來(lái)源:彭博網(wǎng)站截圖

              彭博是一家全球商業(yè)、金融信息和新聞資訊提供商。3月30日,該公司發(fā)布了一篇關(guān)于BloombergGPT開(kāi)發(fā)情況的研究論文,詳細介紹了這一大規模生成式人工智能(AI)模型。該大語(yǔ)言模型(LLM)專(zhuān)門(mén)針對各類(lèi)金融數據進(jìn)行訓練,以全方位支持金融領(lǐng)域的自然語(yǔ)言處理(NLP)任務(wù)。

              據彭博微信公眾號消息,該模型將幫助彭博改進(jìn)現有的金融NLP任務(wù),如市場(chǎng)情緒分析、命名實(shí)體識別、新聞分類(lèi)和問(wèn)題回答等。此外,BloombergGPT還將釋放更多新機遇,調動(dòng)彭博終端上的海量數據,將人工智能的潛力帶到金融領(lǐng)域。

              據介紹,彭博的研究人員開(kāi)創(chuàng )了一種混合訓練法,將金融數據與通用數據集結合起來(lái)訓練模型,以達到在金融基準上取得最佳結果,同時(shí)在通用LLM基準上也保持足夠的競爭力。

              與此同時(shí),彭博的機器學(xué)習產(chǎn)品和研究小組和人工智能工程團隊合作,利用彭博在數據創(chuàng )建、收集和整理方面的資源,構建了迄今為止規模最大的專(zhuān)業(yè)領(lǐng)域數據集之一。

              作為一家金融數據公司,彭博的數據分析師在四十多年的時(shí)間里收集和維護了運用大量金融用語(yǔ)的文檔。開(kāi)發(fā)團隊從這個(gè)由海量英文金融文檔組成的檔案庫中,提取并創(chuàng )建了一個(gè)包含3630億詞例(token)的金融數據集。這批數據又與另一個(gè)包含3450億詞例的公共數據集疊加,成為了包含超7000億詞例的大型訓練語(yǔ)料庫。

              彭博的研究團隊利用該語(yǔ)料庫的一部分內容,訓練了純解碼器(decoder-only)因果語(yǔ)言模型,包含500億個(gè)參數。團隊還對訓練出的模型進(jìn)行了基準測試。金融領(lǐng)域的NLP任務(wù)采用了一套彭博的自有基準,各類(lèi)通用NLP任務(wù)則采用市面上流行的基準。

              彭博稱(chēng),BloombergGPT模型在金融任務(wù)上的表現遠超類(lèi)似規模的開(kāi)放模型,而在一般NLP基準上的表現也達到甚至超過(guò)平均水平。

              彭博首席技術(shù)官肖恩·愛(ài)德華茲(Shawn Edwards)還表示,“BloombergGPT將使我們能夠處理許多新型的應用,不僅比定制化模型的表現更好,而且開(kāi)箱即用,能夠大大縮短上線(xiàn)時(shí)間。”

            (責編: 王東)

            版權聲明:凡注明“來(lái)源:中國西藏網(wǎng)”或“中國西藏網(wǎng)文”的所有作品,版權歸高原(北京)文化傳播有限公司。任何媒體轉載、摘編、引用,須注明來(lái)源中國西藏網(wǎng)和署著(zhù)作者名,否則將追究相關(guān)法律責任。