IT之家1月17日消息,據(jù)彭博社報(bào)道,在當(dāng)?shù)貢r(shí)間周二的達(dá)沃斯世界經(jīng)濟(jì)論壇年會(huì)上,OpenAI首席執(zhí)行官薩姆?阿爾特曼在回應(yīng)有關(guān)其公司盜用版權(quán)材料的指控時(shí)表示,AI并不需要《紐約時(shí)報(bào)》等新聞出版商提供大量的訓(xùn)練數(shù)據(jù)。

圖源Pexels
有些人認(rèn)為,“你需要我所有的數(shù)據(jù)進(jìn)行訓(xùn)練,我的數(shù)據(jù)非常有價(jià)值。”事實(shí)上,情況一般并非如此,例如我們并不想利用《紐約時(shí)報(bào)》的數(shù)據(jù)進(jìn)行訓(xùn)練。
阿爾特曼還表示,公司的很多研究都是如何從少量、高質(zhì)的數(shù)據(jù)中學(xué)習(xí)到更多東西。
在《紐約時(shí)報(bào)》起訴OpenAI和微軟之后,OpenAI正在大力推動(dòng)新聞內(nèi)容的訪問許可。彭博社上周曾援引知情人士消息稱,OpenAI正在與包括CNN、??怂构竞蜁r(shí)代周刊在內(nèi)的出版商洽談新聞內(nèi)容授權(quán)事宜。該公司的知識(shí)產(chǎn)權(quán)和內(nèi)容主管此前告訴彭博社,公司正在進(jìn)行數(shù)十項(xiàng)潛在的授權(quán)交易。
阿爾特曼這次透露了自己仍希望與出版商合作的意愿:“如果出版商愿意的話,我們希望能跟他們合作。例如當(dāng)我們的用戶詢問‘今天達(dá)沃斯發(fā)生了什么’的時(shí)候,我們(的應(yīng)用)就可以說,這是來自彭博社的一篇文章,這是來自《紐約時(shí)報(bào)》的一篇文章。有人愿意與我們合作,但有人不愿意。”

圖源Pexels
IT之家附前情提要:
去年12月27日,《紐約時(shí)報(bào)》在曼哈頓聯(lián)邦地區(qū)法院對(duì)OpenAI和微軟發(fā)起訴訟,聲稱對(duì)方公司“未經(jīng)授權(quán)而使用了數(shù)百萬”文章來訓(xùn)練其AI模型,導(dǎo)致其AI生成的內(nèi)容現(xiàn)在會(huì)與《紐約時(shí)報(bào)》的內(nèi)容“直接競(jìng)爭(zhēng)”。
紐約時(shí)報(bào)聲稱,為ChatGPT提供技術(shù)支持的大語言模型(LLM)“可以生成逐字背誦的《紐約時(shí)報(bào)》內(nèi)容,對(duì)其進(jìn)行總結(jié)并模仿其表達(dá)風(fēng)格進(jìn)行輸出”,這“破壞了”它與讀者之間的關(guān)系,同時(shí)也剝奪了其“訂閱、許可、廣告和附屬收入”。