李彦宏内部讲话曝光,给开源大模型泼了盆冷水(图)
4月11日,第一财经记者获悉,一则李彦宏内部讲话流出。在内部讲话中,李彦宏对大模型开源与闭源的路线选择以及AI创业者应该专注模型还是应用等业界焦点话题,发表了自己的看法。
在讲话中,李彦宏给开源大模型泼了盆冷水,称模型开源的意义不大,它们往往是做小规模的验证应用,并没有经历大算力的验证。此外他还谈到AI创业的话题,认为创业者的核心竞争力本就不应该是模型本身,而是应该去卷应用本身。
为什么不开源?
目前的大模型行业,有以OpenAI GPT-4为代表的闭源大模型和以Meta Llma2为代表的开源大模型两股力量。后者正在快速地拉拢"朋友圈",对前者形成有力冲击。"OpenAI 不OPEN",也成为业界对于明星公司OpenAI"不开源"的一句吐槽。尽管这家公司分享了大量GPT-4的基准、测试结果和生动的演示,但对用于训练该系统的数据、成本或用于创建它的具体硬件或方法等相关信息"守口如瓶",对于是否开源也没有时间表。
作为国内大模型的较早入局者,百度也是选择走闭源路线的一家。对于百度文心一言为什么不开源,今日李彦宏表示,在一年前文心刚刚发布的时候,围绕是否开源,百度内部有过非常激烈的讨论,最后决定是不开源。这是基于当时的判断,大家市场上一定会有开源的模型,而且是不止一家会开源。"在这种情况下,多百度一家开源不多,少百度一家开源也不少。"
李彦宏谈及目前大模型市场上主流的开源模型,如像Llama,Mistral其实都是有相当影响力的,国内的大模型智源、百川、阿里的通义也都是开源的,对百度而言,开源还得自己去维护一套开源的版本,这是不划算的。
不过,紧接着,李彦宏同时给开源大模型泼了盆冷水,称"模型开源的意义其实不是很大,这些开源模型都是在外头零零散散小规模地去做各种各样的验证应用,它没有经过大算力的验证。"
此外,他认为模型开源也不是一个众人拾柴火焰高的情况。"这跟传统的软件开源比如Linux、安卓等等很不一样,由于是模型带来的开源,我们也不知道参数为什么变成了那个样子,这种情况下很难实现众人拾柴火焰高。虽然Llama也鼓励大家去贡献各种各样的数据、代码,但是实际上大家明白最主要的开发者就是Meta这些人,它并不是一个真正由大家一起来协同开发的产品。"
他称反观闭源,是有真正的商业模式的,是能够赚到钱的,能够赚到钱才能聚集算力、聚集人才。"其实也很简单,大家比较一下,比如硅谷有一个优秀的人才,他有OpenAI的offer,有Meta的offer,有Llama的offer,他会去哪儿?这是非常显而易见的选择。"
他称,大家以为开源是免费的,在成本上有优势,实际上也不是,闭源在成本上反而是有优势的。因为只要是同等能力,闭源模型的推理成本一定是更低的,响应速度一定是更快的。反过来,同等参数的情况下,闭源模型的能力也是更强的。"今天不管是在中国也好、在美国也好,最强的基础模型都是闭源的,而各种各样的小模型、最好的小模型,都是通过大模型蒸馏来的。通过大模型降维做出来的模型就是更好的,这样也会导致闭源在成本上、在效率上也会有优势。"
围绕开源闭源,业界一直争论不断。在大模型领域,如同移动互联网时代以苹果为代表的封闭模式和以谷歌安卓为代表的开放模式,大模型因其不确定性形成了开源模式和闭源模式同时推进的基本格局。
一位大模型从业者对第一财经记者表示,如今大模型行业远不到一家垄断或是一家独大的局面,无论开源、闭源,每个公司都有自己的路线选择,总有人相信"开源的力量"。开源可以降低AI大模型的使用门槛,因为开源大模型意味着无数开发者可以基于大模型来开发基础设施工具和应用,有望加速下游行业AI应用的开发效率、促进生态的蓬勃发展。同时,开源意味着更多的人可以审查它,识别并修复可能的问题,从而提升了安全性。
此前,百川智能CEO王小川在接受第一财经记者采访时也曾谈到开源与闭源之争,王小川说,开源确实容易"建立人品","朋友多多的",让大家迅速了解和评测;同时开源也是为商业化做准备,如果大家用起来觉得不错,当需要更好的服务和更大的参数时,可以探索进一步的商业化路径。
但是他认为,开源和闭源并不像手机中iOS或者安卓操作系统只能二选一,从tob角度,开源闭源其实都需要。他预计未来80%的企业会用到开源的大模型,因为闭源没有办法对产品做更好的适配,或者成本特别高,闭源可以给剩下的 20%提供服务。二者不是竞争关系,而是在不同产品中互补的关系。
开源大模型对于开发者同样有着重要意义。此前一位大模型开发者告诉第一财经记者:"首先是即便开源大模型参数不够大,但如果在非常大的数据集上训练模型,那么在性能方面也可以与参数非常大的模型竞争;其次,是一些小型的企业可以用很少的预算和适量的数据将小模型微调到与大模型相媲美的程度。"
此外,由于开源模型支持不同的团队在彼此的工作基础上进行构建,因此开源模型的进步速度比封闭生态系统快得多。
AI创业者的核心竞争力不是模型本身
除了谈开源闭源之外,李彦宏提到,对于AI创业者来说,核心竞争力本就不应该是模型本身。"这太耗资源了,而且需要非常长时间的坚持才能跑出来。创业者真正的优势应该是在某一个领域的知识、数据。"
他认为,外界一些做模型的创业公司讲的所谓的"双轮驱动"不是一个好的模式。既做模型又做应用,势必会分散精力。创业公司的精力和资源都是有限的,同时做两件事情和只做一件事情哪个成功率更高是不言自明的。在任何情况下我们都非常讲专注力,"力出一孔",当资源有限的时候更应该专注,而不是去搞所谓的"双轮驱动"。
他举个例子,假如说今天想找一个"黄色的无兜的男士泳裤",在任何一个今天的电商平台上都找不到,这种需求目前的技术是解决不了的,大模型如果有领域知识就可以解决,这就是靠领域知识能够提供独特价值的例子。市面上有这么多模型,大的、小的、开源的、闭源的,在特定应用当中怎么样使用这些模型的组合,是有技巧的,这是创业者可以干的事儿,是可以提供价值增益的。
他还提到创业者的担心:如果用了文心或者闭源模型,做得好了就抄袭,巨头把创业者的饭吃掉了。"大家去看一看,在移动时代,微信没有去吃掉拼多多,滴滴也没有变成腾讯的一部分,它们都各自提供了自己独特的价值,有自己非常不一样的竞争力,它们的兴起都是依赖移动生态里的一个封闭平台——微信,但是它们并不怕微信去抢它的饭碗,所以没有必要担心基础模型通吃AI的应用。"
事实上,李彦宏这番表态的背后,大型语言模型的开发是非常庞大且处于较为早期的阶段,基于大模型开发出来的AI原生应用仍非常少。大模型本身是基础底座,类似操作系统,最终开发者要依赖为数不多的大模型来开发出各种各样的原生应用。
目前,已经有一大批创业者奔向AI创业的战场,AI大模型有望从拼参数逐步进入到拼原生应用、拼产业落地的阶段。业界预计,大模型下一个阶段有望迎来应用层之战。
此前百度表示开放一批经过全新重构的AI原生应用,并在内部展开内部"赛马",所有产品都在基于原生思维进行重构。在应用层,此前科大讯飞、360等先后发布了在工业、金融、教育、医疗、AI数字人等领域的应用产品,开放开发者接口;百川智能CEO王小川对记者透露,今年内部团队开始部署C端超级应用,在他看来,落地和应用方面是中国创业者的强项。