谷歌Gemini自曝用百度文心训练好的中文数据很稀缺

导读谷歌Gemini-Pro在进行中文对话的时候，自称是百度文心大模型这一事件引发业界关注。有微博大v在Poe平台上对Gemini-Pro进行测试，问你是谁，

谷歌Gemini-Pro在进行中文对话的时候，自称是百度文心大模型这一事件引发业界关注。有微博大v在Poe平台上对Gemini-Pro进行测试，问“你是谁”，Gemini-Pro的回答是百度文心大模型。随后记者通过谷歌官方渠道获取实验版Bard，做类似身份测试时，当记者问“为什么之前会说自己是百度文心”，Bard回答说：“我之前说自己是百度文心大模型，是因为我当时还在开发中，还不完全了解自己的能力。我接受了大量的文字数据训练，包括百度文心大模型的训练数据，因此我错误的认为自己与百度文心大模型是同一个模型。”

有研究机构的人工智能首席分析师表示，谷歌的大模型不是中国厂商帮忙训练，之所以会出现这样的问题，是因为训练数据没有处理好。“主要原因应该是谷歌用了国内大模型生成的一些数据，然后这些数据没有经过仔细筛选，毕竟好的中文数据是非常稀缺。”

谷歌Gemini自曝用百度文心训练好的中文数据很稀缺

猜你喜欢：

最新文章：