OpenAI高管再次语塞,Sora是否使用YouTube数据问题再添新疑问

移动终端 2024-05-14 12:07 阅读:7

OpenAI的另一位高管在被问及Sora视频生成器是否使用了YouTube数据时,同样陷入了困境。在最近举行的Bloomberg科技峰会上,OpenAI席运营官Brad Lightcap在回答记者Shirin Ghaffary的问题时,以迂回冗长的方式回应,没有给出明确答案。

"你能否说出Sora是否使用了YouTube数据?" Ghaffary问道。Lightcap的回答是一段冗长的话语,试图转移对Sora训练数据的质疑。

"嗯,我是说,关于数据的讨论非常重要," Lightcap说道。"我们显然需要道数据的来源。"

在对未来的"AI内容识别系统"进行详细描述后,这位高管似乎比OpenAI的首席技术官Mira Murati更接近承认Sora是使用了YouTube数据进行训练。

"是的,我们正在研究这个问题," Lightcap说道。"这确实非常困难。"他接着说,虽然OpenAI对这个"困难"问题还没有"所有答案",但可能会在2026年之前找到。

"那么,对于YouTube的答案呢?"Ghaffary反问道。"暂时没有答案。"

Lightcap在镜头前的这个失态引起了人们对于Murati在三月份类似尴尬回答的回忆。当时,在接受华尔街日报采访时,这位首席技术官在被直接问及Sora是否使用了YouTube数据时也犯了同样的错误。

"我们使用了公开可获得的数据和授权数据," Murati说道。

"那YouTube上的视频呢?"华尔街日报的Joanna Stern追问道。

"对此我其实不确定,"这位首席技术官回答道,并在一段长时间的追问后试图解释自己,称虽她认为这些数据是"公开可获得的",但对此并不确定。

在尴尬的交流之后,Murati向该报纸证实使用了Shutterstock的视频,但关于Sora训练数据是否还包括YouTube视频,仍然存在争议。然而,正如一位财经记者开玩笑所说,Lightcap的回应几乎可以肯定Sora确实使用了YouTube数据。

"Sora是OpenAI的视频生成器,该公司之前进行的展示被揭露为并非由Sora生成。Sora被怀疑使用了大量YouTube数据进行训练,而OpenAI的高管们一直回避承认这一事实。这一事件引发了人们对于AI训练数据的透明度和道德问题的广泛讨论。"