早間投資機會:AI大模型訓(xùn)練數(shù)據(jù)版權(quán)問題凸顯 優(yōu)質(zhì)訓(xùn)練數(shù)據(jù)庫價值有望重估
知情人士稱,美國社交媒體平臺Reddit已同谷歌達成協(xié)議,將其內(nèi)容用于訓(xùn)練后者的人工智能模型。據(jù)悉,協(xié)議價值約為每年6000萬美元。Reddit已公開提交美國IPO文件,摩根士丹利、高盛、摩根大通及美國銀行為牽頭行。 近期,新聞出版巨頭施普林格出版集團(Axel Springer)與ChatGPT開發(fā)機構(gòu)OpenAI簽署協(xié)議,成為全球第一家與OpenAI合作將新聞業(yè)與人工智能技術(shù)進行更深入整合的出版機構(gòu)。銀河證券指出,Open AI與Axel Springer簽訂的協(xié)議表明,人工智能在使用媒體品牌內(nèi)容進行大模型訓(xùn)練時將需要向媒體品牌付費,這意味著AI大模型向數(shù)據(jù)提供方的知識產(chǎn)權(quán)付費或?qū)⒊蔀樾袠I(yè)趨勢。當前AI政策密集出臺,高質(zhì)量數(shù)據(jù)集和訓(xùn)練數(shù)據(jù)版權(quán)問題得到重視,未來優(yōu)質(zhì)訓(xùn)練數(shù)據(jù)庫的價值將得到凸顯。出版行業(yè)公司大多擁有豐富的電子化的圖文資源,這可以作為國內(nèi)外大模型訓(xùn)練的重要數(shù)據(jù)集。出版行業(yè)公司在版權(quán)和IP上的資源優(yōu)勢有望助力其作為海內(nèi)外AI大模型研發(fā)的重點助力。 據(jù)財聯(lián)社主題庫顯示,相關(guān)上市公司中: 中信出版已嘗試與作者和大模型公司合作語言訓(xùn)練,開發(fā)智能閱讀應(yīng)用產(chǎn)品。例如,公司旗下的知識服務(wù)平臺與百度聯(lián)合發(fā)布了“中信書院AI閱讀助手”插件。 掌閱科技在文學和閱讀領(lǐng)域的版權(quán)儲備業(yè)內(nèi)領(lǐng)先,這些中文語料可以用于網(wǎng)文行業(yè)垂類模型訓(xùn)練。公司與字節(jié)目前主要在數(shù)字閱讀的版權(quán)、內(nèi)容生產(chǎn)、廣告商業(yè)化等多方面開展了深度合作。 |