导读 Openai公司正式宣布将会推出数据伙伴关系计划,其目的就是为了和第三方机构进行合作,增加用来训练人工智能模型的私有数据集。训练人工智能
Openai公司正式宣布将会推出数据伙伴关系计划,其目的就是为了和第三方机构进行合作,增加用来训练人工智能模型的私有数据集。训练人工智能模型的数据集一直以来都存在着缺陷,这已经是整个行业内人人皆知的消息,就比如图像语料库就经常会以西方国家为中心,因为在编辑数据集时这些地方的图像在互联网中的占比较多,所以最终所训练出来的人工模型就放大了这方面的缺陷。
在当地时间2023年11月9日,Openai公司在官网中正式宣布,希望能够和外部的第三方机构一同合作来创建新的数据集。Openai公司从公告中正式宣布了数据伙伴关系计划,公司在广告中表示该计划其目的就是为了能够让更多的组织来参加到人工智能的构建中,并且可以从人工智能的构建中获得一定的见识和见解。
Openai公司官方表示,为了确保人工智能能够安全的服务于社会,所以公司希望人工智能模型能够符合目前所有的主题行业和文化,这就需要尽可能的收集到更多的数据集。将自己的数据纳入到数据集中,就可以增加人工智能模型对于不同领域的见解。如果有必要的话,那么公司将会和组织进行合作、用光学字符和语音识别工具来挑选训练数据,将敏感或者涉及到个人隐私的信息删除。
Openai公司希望能够创建两种不同类型的数据集,第1种是公开的开源数据集,所有的企业都可以将其利用在人工智能模型的训练上,另一种是私有的数据集,只能够训练自己公司制度研发的人工智能模型。提供适用数据集的对象,希望能够将数据进行保密,不过也希望 Openai公司的模型能够更好地处理该数据及所在领域的相关信息。