绿茶通用站群绿茶通用站群

Meta继续押宝开源大模型 Llama 3拿下“赛点”?

Meta继续押宝开源大模型 Llama 3拿下“赛点”?

开源与闭源之争延续到大模型(xíng)时(shí)代。在寻找“新大陆(lù)”的路上,开源与闭源的辩论,就像是一场关于AI未来的“航海策略”讨论。

开源一派认为,开源能够促进全球(qiú)科研人员和开发者的协作,加速AI技术的迭代与创(chuàng)新。同 时,开源让更(gèng)多人参与到模型的改(gǎi)进和优化中,通过 集体智(zhì)慧解决复杂(zá)的技术难题。

闭源的倡导者则看重(zhòng)其在商业(yè)化、技术保护和(hé)产品差异化方面的优势。闭源模型(xíng)使得企业(yè)能够控制产品的开发节奏和市场策略,保(bǎo)护其商业利益(yì)。此外,闭源也有(yǒu)助于企业维护其技术优(yōu)势,避免竞争对手模仿或超越。

Llama 3的发布让开源大模型在与闭源的竞争中再度“扳回一城”。从测试结果来看,Llama 3的(de)成绩大(dà)幅超越了Llama 2,也胜过了(le)GPT-3.5。

在AI这场没有硝烟的“航海竞(jìng)赛”中,大模型已然成为眼前的灯 塔。未知的是,这座灯塔究竟是向所有航海(hǎi)者开放其光芒,还是(shì)仅为(wèi)特定的船只照亮前行的航道。

开源在开发者和(hé)研究人员中极受欢迎

Meta正沿着开源路(lù)径继续前进。

近日,Meta推出开源大模型Llama 3系列,发布8B和(hé)70B两个版本。Meta创始人兼首(shǒu)席执行(xíng)官扎克伯(bó)格在同一天宣布,基于Llama 3,Meta的AI助手现在已经覆(fù)盖Instagram、WhatsApp、Facebook等(děng)全系应(yīng)用,并单独 开启了网站。

与Llama 2相比,Llama 3进行了几项关键的改进:使用(yòng)具128K token(输入数据的最小单元)词汇表(biǎo)的tokenizer(编译器),可以更有效地编码语言,从而显著提升模型性能(néng);在8B和70B模型中都采用分组查询注意(yì)力(GQA),以提高Llama 3模型的推理效率;在8192个(gè)token的(de)序列上(shàng)训练模型,使用掩码来确保自注意力(lì)(Self-Attention)不会跨越文档 边界。

据Meta介(jiè)绍,Llama 3已经在多种行业(yè)基准测(cè)试上展现了最先进的(de)性(xìng)能,提 供了包括改进的推理能力在内的新功能,是目前市场上最好 的开源大模型。

此外,Llama 3发布后,微软Azu陕西煤业:2023年净利润同比下降39.67% 拟10派13.15元re、谷歌云、百度智能云等陆续宣布其平台上线Llama 3。百度方面此前对《每日(rì)经济新(xīn)闻》记者表示(shì),百度智能云千帆大模型平台在国内首家推出针(zhēn)对Llama 3全系(xì)列版本的训练推理方(fāng)案(àn),便于开发者进行再(zài)训练,搭建(jiàn)专属大模型。

工业和(hé)信息化(huà)部工业(yè)文化发展中心AI应用工作组执行组长、行行AI董(dǒng)事长李明顺在接受《每日经济新闻》记者采访(fǎng)时表示,Meta的Llama 3发(fā)布可能会带来更多AI应(yīng)用落地机会和场景,它通过(guò)提供更大(dà)词汇量的Token词典、更长的 输入上下文长度以(yǐ)及优化的模型结构,增强了模(mó)型的(de)编码效率和推理效率。“现在,比 起Llama 2,Llama 3在代(dài)码能力(lì)和逻辑(jí)推理能力(lì)上有显著提升 ,这可(kě)能(néng)会促进相关 AI应用的性能(提升),尤其是在需要复杂逻辑和代码(mǎ)理解的场景中去(qù)落地。”

OpenAI在GPT-2之后调转船头(tóu)走向闭源,Meta则成为开源界的引领者(zhě)之(zhī)一。

从(cóng)2020年发布(bù)GPT-3,到引发轰动的GPT-3.5,以及2023年3月发布的GPT-4,都是闭源模型。此(cǐ)前,马斯克起诉OpenAI时曾(céng)直 言:“如果OpenAI改 名(míng)为ClosedAI,我就撤(chè)销诉讼(sòng)。”

李(lǐ)明顺认为,OpenAI的转变(biàn)可能与其商业战(zhàn)略和(hé)市场定位有(yǒu)关。“初期开源有助于快速吸引关注和社区参与(yǔ),但随着公司的发展,我估计阿尔特曼(Sam Altman)的野心和商业梦(mèng)想越来越(yuè)膨胀了,闭源可以更好地让(ràng)它融资,包括和微软合作,保护领先的技(jì)术优(yōu)势(shì)。”他表示,从OpenAI的转变中可以看出,开(kāi)源与闭(bì)源的选择(zé)并非固定不变,而 是需要根据公司战略 目(mù)标、市场环境和(hé)产品发展 阶段灵(líng)活(huó)调整。天下没什么事情是绝对的,很多开(kāi)源公司也是拿(ná)着次优代(dài)码开(kāi)源,独家秘方闭源。

在追(zhuī)逐AGI(通(tōng)用人工智能)这 颗明珠 的道路上,迄(qì)今为止,Meta依旧持续沿着开源(yuán)的路径前(qián)行。

2024年初,扎克伯格在Meta第四季度及2023全年财(cái)报电话会(huì)议上表 示:“长期以来,我们的策(cè)略是构建并开放(fàng)源代码通用基础设施,同时保留我(wǒ)们的具(jù)体产(chǎn)品实现为(wèi)专有技术。”

他认为,开源带来了几个战略(lüè)好处。首先(xiān),开源软件通常更加(jiā)安全可靠,并(bìng)且因为社(shè)区的 持续反馈、审查和开发,更加高(gāo)效。其次,开源软件经常成为行业标(biāo)准,“当(dāng)企 业开始基于(yú)我们的技术栈(zhàn)建立标准时,这使得将创新(xīn)融入我们的产品(pǐn)变得(dé)更(gèng)加容(róng)易。这种微妙的(de)优势(shì),能够迅速学习(xí)和改进,是巨大的竞争优势,而成(chéng)为行业标准(zhǔn)正是这一(yī)能(néng)力的(de)关键”。第三,开源在开发者和(hé)研究人员中极受欢迎(yíng)。

开源与闭源(yuán)并不矛盾

开源还是闭源(yuán),也许是全球人工智能(néng)信徒长久的辩(biàn)题。在Llama 3诞生前几天,国内同样在进行一场“辩论”。

4月 11日,百度董事长兼首席执行官李彦宏在其内部讲话(huà)中直言,大模(mó)型开源的意义不大,闭源模型在能力上会持续领先,而不是一时领先,做(zuò)模型(xíng)的创业公司既做模型又做应用的“双轮驱动”不(bù)是一(yī)个好的模式。在(zài)一周后的Create 2024百度AI开发者大(dà)会(huì)上,李彦宏(hóng)再度提到,大(dà)家以前用开源觉(jué)得开(kāi)源便宜,其实在大模型场景下 ,开源是最贵(guì)的,所以开源模型会越来越落后。

360公司创始人周鸿祎则持(chí)不同的观点。他表示:“网上有些名人胡说八道,大家也(yě)别被他们忽悠,说(shuō)开源不如闭源(yuán)好。一句话,今(jīn)天(tiān)没有(yǒu)开源就没有Linux(操作系(xì)统内核),没有Linux就没有互联网,就连说这话的(de)公司自己都借助了开源的力量才成(chéng)长到今天。”

这(zhè)段发言被解读为对李(lǐ)彦宏观点(diǎn)的(de)回(huí)怼,周(zhōu)鸿祎随后澄清道:“我(wǒ)一(yī)直是开源的信徒,但(dàn)是(shì)我说开源好,是(4月)13日在哈佛讲的(de),李厂长(指李彦宏)说(shuō)闭源好,是(4月)16日在北京讲的。”

生数科技联(lián)合创(chuàng)始人兼CEO唐家渝站(zhàn)在闭(bì)源的一边。在4月18日举行的“2024中国(guó)生成式AI大(dà)会”上,唐家渝表示:“在(zài)我们看来,开源、闭源都有各自可以做的商业生 态,但是从(cóng)模(mó)型能力(lì)的提升来说,或者持续走到(dào)前列(liè)来说,闭源还是会走到(dào)开源的前面。”

昆仑万维董事长方汉的观点是,开(kāi)源(yuán)模型与闭(bì)源模型(xíng)之间的差距正在不断缩小。4月16日(rì),方汉 在接受《每(měi)日(rì)经 济(jì)新闻》记者在内的媒体采访时表示,闭源(yuán)模型的确是第一(yī),但是开源大模型在(zài)2023年到今年这一年间,从落后两年以上,已经进化到落(luò)后4~6个月以上。

此(cǐ)外,方汉认为,在应用侧,闭源对于(yú)产品特性和长尾需求的满足都落后于开(kāi)源大模型,开源大模型陕西煤业:2023年净利润同比下降39.67% 拟10派13.15元是一种生态构(gòu)建(jiàn)器,更利于满足用(yòng)户的长尾需求(qiú)。开(kāi)源大(dà)模型(xíng)和闭源(yuán)大模型是一个生态的组成部分(fēn),不(bù)是谁压倒谁,大家都有自己的生存空间,也都有更好的明天(tiān)。

不过,从(cóng)商(shāng)业化 上(shàng)来讲,闭源和开源也许(xǔ)并不矛盾。启明创(chuàng)投合伙人周志峰就认为(wèi),开(kāi)源闭源在过去几个大浪(làng)潮当中没有很大(dà)的冲(chōng)突,不(bù)太(tài)理解为什么很(hěn)多人把闭(bì)源(yuán)、开(kāi)源在AI时代看成对立的。

李明顺的观点则是,在当前强应用导向(xiàng)的背景(jǐng)下,开(kāi)源模式(shì)具有显著(zhù)优势,能够吸(xī)引全球范(fàn)围内最(zuì)广泛的人参与,从而使(shǐ)其创新性(xìng)保持在较高水平(píng)。

相较之下,尽管一些闭源大模型在(zài)技(jì)术上具有领先(xiān)地位,但其成本太高。不过(guò)他也强调,开源与闭源在(zài)不同公司和应用场景中可以相互转换。一些基于开源的产品在发掘到独特优势后,可(kě)能会通(tōng)过闭源策略建立(lì)竞争(zhēng)壁垒。同时,一些闭源公司也(yě)会不断将(jiāng)其部分产品开源。这两个应该是共存(cún)的,未来开源(yuán)可能用户量级上(shàng)更大,但是行业内(nèi),商业化做得比较好的公司,往往还是闭源的多一点。

在开源(yuán)与闭源的辩论中,也许(xǔ)答案并非非(fēi)此即彼。AI的未来可能既不是完(wán)全开放的(de)“自由港”,也(yě)不(bù)是彻底封闭的“孤岛”,而是一个既包含开放协作也包含封闭竞争的混合生态。在这个生态系(xì)统(tǒng)中,开放与封闭不是对立(lì)的两极,而是一枚硬币的两面。

未经允许不得转载:绿茶通用站群 陕西煤业:2023年净利润同比下降39.67% 拟10派13.15元

评论

5+2=