导读 10月31日,百川智能创始人兼首席执行官王小川在云栖大会上演讲称明年中国将会有若干大模型超级应用。他还表示,今年年底之前国内会有几家公
10月31日,百川智能创始人兼首席执行官王小川在云栖大会上演讲称明年中国将会有若干大模型超级应用。他还表示,今年年底之前国内会有几家公司做到GPT-3.5的水平,明年也有信心可以做到GPT-4的水平,不过是达到并不是超越。
今年4月份前搜狗公司CEO王小川就宣布自己看好大模型,还创立了AI大模型公司“百川智能”,旨在打造中国版的OpenAI,完成天使轮融资之后,百川智能估值5亿美元。10月17日完成A1轮融资之后,这家仅仅成立不到半年的公司成为金融市场当中的独角兽。本次会议上王小川还对外阐释了百川智能的大模型理念,“理想上慢一步,落地上快三步”。王小川还介绍百川智能在半年的时间里发布了7款大模型,日前推出的Baichuan2-192K大模型能够处理大约35万个汉字。
谈到之前在旅美时和OpenAI的交流时,王小川表示现在OpenAI正在研究把1000万颗GPU连在一起做大模型的技术,GPT-3.5用到了4000颗GPU,GPT-4是25000颗,而英伟达现在一年的生产能力只有100万颗,OpenAI现在的设想简直就像登月一样,王小川还表示,对他们充满敬畏。不过随后他也称,自己在应用方面可能走得更快一些。王小川还介绍道,语言模型是通用智能时代的起点,语言模型就是现实世界里面的数学模型。从技术上面来说,语言感知比图片视频感知更难,智力也并不是逻辑推理的能力,而是一种抽象和比喻的能力。他还巧妙地打比方称,牛顿用定律把物理现象都变成数学问题,现在的大模型也是把语言变成数学模型,这有着划时代的意义。