导读 MiniMax1月16日宣布正式上线国内首个MoE大语言模型abab6。该模型在MoE结构下,经过了半个月的内部测试,以及一部分客户的反馈,已经拥有了
MiniMax1月16日宣布正式上线国内首个MoE大语言模型abab6。该模型在MoE结构下,经过了半个月的内部测试,以及一部分客户的反馈,已经拥有了对复杂任务进行处理的能力,在单位时间,能够将训练效率提升。与之前的abab5.5版本相比在,对模型输出有更精细要求的场景和处理更复杂的事物时都做出了改进。
MiniMax自2023年4月发布开放平台以来,已经为近千家客户提供了服务,包括小红书、小米、腾讯、阅文、金山办公等多家互联网公司。MiniMax表示与新进模型GPT-4相比,abab5.5还有着一定的差距,差距主要表现在针对更复杂场景的处理时可能会发生错误或者是违反用户要求的输出格式。MiniMax为了解决此问题,自6月份开始进行MoE模型abab6在研发,所运用的参数规模与之前相比更大,在复杂任务下有望取得更好的效果。