导读 数据标注工作在大语言模型的运行环境就像是一个内容过滤器一样,会对相关问题筛选出质量比较高的回答,并且按照分数顺序,最终将最高分数以
数据标注工作在大语言模型的运行环境就像是一个内容过滤器一样,会对相关问题筛选出质量比较高的回答,并且按照分数顺序,最终将最高分数以及最完美的回答呈现给用户。这一部分的工作有的是依靠技术完成,有一部分则是需要依赖人工完成。
标注师日常的工作是对大模型生成的内容进行评价以及反馈,通过人工标注的方式,让大模型可以学习人类的思维方式,将大模型锻炼得越来越聪明。百度智能源大模型标注师向记者介绍到:“和传统的数据标注师要求不同,大模型标注师都需要本科以上学历。我觉得主要是因为大模型数据涉及的知识面很广,评判标准复杂,非常考验标注时的语言理解能力和逻辑推理能力。在入职前两个月,公司会对我们进行集体培训和考核,通过考核之后才能正式上岗。”