导航菜单

谷歌Gemini自曝用百度文心训练 好的中文数据很稀缺

导读 谷歌Gemini-Pro在进行中文对话的时候,自称是百度文心大模型这一事件引发业界关注。有微博大v在Poe平台上对Gemini-Pro进行测试,问你是谁,

谷歌Gemini-Pro在进行中文对话的时候,自称是百度文心大模型这一事件引发业界关注。有微博大v在Poe平台上对Gemini-Pro进行测试,问“你是谁”,Gemini-Pro的回答是百度文心大模型。随后记者通过谷歌官方渠道获取实验版Bard,做类似身份测试时,当记者问“为什么之前会说自己是百度文心”,Bard回答说:“我之前说自己是百度文心大模型,是因为我当时还在开发中,还不完全了解自己的能力。我接受了大量的文字数据训练,包括百度文心大模型的训练数据,因此我错误的认为自己与百度文心大模型是同一个模型。”

有研究机构的人工智能首席分析师表示,谷歌的大模型不是中国厂商帮忙训练,之所以会出现这样的问题,是因为训练数据没有处理好。“主要原因应该是谷歌用了国内大模型生成的一些数据,然后这些数据没有经过仔细筛选,毕竟好的中文数据是非常稀缺。”

免责声明:本文由用户上传,如有侵权请联系删除!

猜你喜欢:

最新文章: