绿茶通用站群绿茶通用站群

表示第一的词语四字,古代表示第一的词语

表示第一的词语四字,古代表示第一的词语 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊(liáo)天机器人ChatGPT火爆以来,微(wēi)软公司创始人比尔(ěr)·盖茨已多次公(gōng)开谈论(lùn)人工智能话(huà)题(tí)。在(zài)最(zuì)近的一(yī)次采访(fǎng)中(zhōng),他再(zài)次表示:“AI可能会让科(kē)技行(xíng)业迎(yíng)来(lái)一次剧烈的洗牌(pái)”。

这个结论(lùn)是他在当地时间2月(yuè)20日接(jiē)受《In Good Company》节目专访时提出的(de)。

他预(yù)期,AI的(de)发展可能会威(wēi)胁到谷歌的市占率,因为微软在(zài)AI方面的(de)行(xíng)动相当迅速(sù)。而最(zuì)终科技巨(jù)头将把AI整合成用(yòng)户的“全能助手”,包揽一切(qiè)应(yīng)用,与人们进(jìn)行沟通并提(tí)供建议,可以取(qǔ)代亚马逊、Siri或Outlook等应用。

大(dà)佬(lǎo)口中全能助手(shǒu)的到来(lái)可能尚需时日(rì),但由(yóu)ControlNet引发的又一(yī)次(cì)AI绘画(huà)浪潮(cháo),让A表示第一的词语四字,古代表示第一的词语IGC在ChatGPT的话题热(rè)点包围(wéi)中杀(shā)出重围。

ChatGPT之后又一应用杀疯了,AIGC或(huò)进(jìn)入可控期,将洗牌科技行业?_黑(hēi)料正(zhèng)能量

01

ControlNet颠(diān)覆AI绘画(huà)新玩法

AIGC向可控(kòng)靠近

以AI绘(huì)画为代表的AIGC上一次爆火(huǒ)的时候,还是2022年8月,在(zài)美国科罗拉多州举办的新兴(xīng)数字(zì)艺术家(jiā)竞赛中,一幅名为《太(tài)空歌剧院》的作品(pǐn)获奖。

随(suí)后各(gè)大厂商的AI绘画软件被广大(dà)网友熟知并体验,Stable Diffusion便是(shì)其中代(dài)表(biǎo)。

ChatGPT之后又一应用杀疯了,AIGC或(huò)进入可控(kòng)期,将洗牌科技行(xíng)业?_黑料正能量

用户们可以在应用中输入(rù)一组关键词或者一(yī)张照(zhào)片(piàn),就能获得(dé)一幅AI创作的画作。

作画的关键就是所(suǒ)输入的文本。同一组关键词(cí)也可以创作出很多张风(fēng)格不一样(yàng)的(de)画(huà)作,这让创作(zuò)的(de)过(guò)程就像开盲盒(hé)。

很多用户很(hěn)喜欢这种不确定的惊喜,他们会将(jiāng)生(shēng)成(chéng)的美(měi)图(tú)当做头像。而(ér)另一部分喜(xǐ)欢翻(fān)看AI绘(huì)画的“翻(fān)车(chē)”作(zuò)品。在社(shè)交媒体(tǐ)上,许多(duō)用户(hù)分(fēn)享AI“翻车现场”,例(lì)如,一位网友(yǒu)的(de)小(xiǎo)狗照片(piàn)被AI画成了“肌(jī)肉男”,还有网友的(de)个人照(zhào)片被AI识(shí)别成了建筑。

而如今随着ControlNet的出现(xiàn)与(yǔ)加持,以往(wǎng)AI绘画(huà)的填写关键词游戏(xì)可能要(yào)被颠(diān)覆了。

ChatGPT之后又一应用杀疯了(le),AIGC或(huò)进(jìn)入可控期(qī),将洗牌科技行业(yè)?_黑料正(zhèng)能(néng)量(liàng)

ControlNet是一(yī)位正在(zài)斯坦福读博的中国人(rén)张(zhāng)吕敏创作(zuò)的一种基于控制点的图像变形(xíng)算(suàn)法,主要用于数字(zì)图像处理、计算机视觉(jué)和(hé)计算机图形学等(děng)领(lǐng)域。

其(qí)SD插件(jiàn)一经(jīng)发布(bù),在短短的两天(tiān)内便成(chéng)为了AI绘画领(lǐng)域最新的热点。

在此之前,大家用了(le)很多方法(fǎ)想(xiǎng)让AI生成的结果尽可(kě)能的符合要求,但是都不尽如(rú)人意(yì),它(tā)的出现(xiàn)代表着AI生成(chéng)开始(shǐ)进入真正(zhèng)的(de)可控时期(qī)。

因为ControlNet可以(yǐ)直接提取画面的(de)构图,人物的姿势和画面的深度信(xìn)息等。有了它的(de)帮助,就不用频繁的用提(tí)示(shì)词来碰运气,抽盲盒式的创(chuàng)作(zuò)了。

通俗的(de)说ControlNet相当(dāng)于给AI绘(huì)画加了“魔法”,不少博主的作品已经获得了(le)大(dà)量的(de)浏览量(liàng),“viggo”就是其(qí)中之(zhī)一,他用朋友的(de)照(zhào)片直接(jiē)带她们走进动漫世(shì)界。

ChatGPT之后(hòu)又一应用杀疯了,AIGC或进入可(kě)控期,将洗牌科技行(xíng)业?_黑(hēi)料正(zhèng)能(néng)量(liàng)

viggo先(xiān)用StableDiffusion图(tú)片转文(wén)字。

再用Text2Prompt插(chā)件拓(tuò)展找到对应的(de)关键词;最后用ControlNet插件绑定骨骼(gé)开(kāi)始换(huàn)关键词(cí)试效(xiào)果。

ChatGPT之后又一应(yīng)用杀疯了(le),AIGC或进入(rù)可控期,将洗牌科技行(xíng)业?_黑料(liào)正能(néng)量

通过图(tú)片就可(kě)以(yǐ)看出来,效果(guǒ)十分惊艳。

ChatGPT之后又一应(yīng)用杀(shā)疯了,AIGC或进入可(kě)控期(qī),将洗牌科技行(xíng)业?_黑料正能量

ChatGPT之后又(yòu)一应用(yòng)杀疯了(le),AIGC或(huò)进(jìn)入可(kě)控期(qī),将洗牌科技行业?_黑料正能量(liàng)

更厉害的是,除了真实(shí)的照片(piàn),草图也可以加上“魔法(fǎ)”,知乎大牛“DevPoint”和(hé)“逗(dòu)砂(shā)”介绍到ControlNet还能实现线稿(gǎo)转全彩图(tú)。大神(shén)张吕(lǚ)敏其本尊也亲自回应。

ChatGPT之后又一应用杀疯(fēng)了,AIGC或(huò)进入可控期(qī),将洗牌科技(jì)行业?_黑(hēi)料正能量

不(bù)得(dé)不说当下(xià)AIGC已经变(biàn)得越来越强大,甚(shèn)至输出的作品都已经能以假乱(luàn)真了。

02

难辨虚实,AIGC技术力爆发(fā)

警惕(tì)安全问题

近日,“苏(sū)州金鸡(jī)湖有游艇(tǐng)party”的消息火遍网络(luò),而(ér)经过(guò)警方(fāng)辟谣(yáo)这所谓的“party”可(kě)能是全国第(dì)一起(qǐ)AI绘图诈骗。

由于这个活动里面给出(chū)的美女照片都是AI制作的(de)真(zhēn)人照片绘图,因为太逼真(zhēn),被大家当成真事传播(bō)了

ChatGPT之后又一应(yīng)用杀疯了,AIGC或进入可(kě)控期,将洗牌科(kē)技行业?_黑(hēi)料正能量

不(bù)过仔细观察(chá)可以发现,活动发起(qǐ)者(zhě)提供的照(zhào)片中有个很大的漏洞可以发(fā)现(xiàn)并非(fēi)真(zhēn)人(rén),而是AI绘图,那便是图片中女性的手指部分有的存在异常。

ChatGPT之(zhī)后又一(yī)应用杀疯(fēng)了,AIGC或进入可控期,将洗牌科(kē)技(jì)行业?_黑料(liào)正能量

有行业人事表示:“现在因为(wèi)手指部分(fēn)的(de)绘画算(suàn)法比较复(fù)杂,AI还不(bù)太会(huì)画人的手,但最新看到的图片已经有(yǒu)越(yuè)来越完美的AI模型出现,以(yǐ)后可能就完(wán)全没有漏洞了(le)。

类似的(de)AI作图诈骗(piàn)在国外也已有发生。据英(yīng)国广播(bō)公司报道,土耳其(qí)地震(zhèn)期间,有Tiktok用(yòng)户使用AI合(hé)成了(le)儿(ér)童受灾的假照片发布到网络,以此诱骗善良的(de)人(rén)打赏“捐助”从而实施诈骗(piàn)。

目前随(suí)着技(jì)术(shù)发(fā)展,AIGC已(yǐ)经能做出真人(rén)照(zhào)片般的绘(huì)图效果,如果这(zhè)样的(de)图片被用来诈骗,将(jiāng)非常可怕。

此外AIGC还引发了很多(duō)担(dān)忧(yōu),一方面,批判(pàn)者(zhě)认(rèn)为AI在(zài)“学(xué)习”了大量前人的(de)作品之后,其(qí)创作没(méi)有任何情绪和灵魂,难以和人(rén)类(lèi)的艺术创(chuàng)作相提并论(lùn)。

另一(yī)方面,AIGC背(bèi)后的版权、目前都并没有(yǒu)得到有效的解决,还有AIGC会(huì)不会代替人类“至高(gāo)无上”的创(chuàng)意。

马(mǎ)斯克也强调,人工(gōng)智能的安全问题需要得到重视(shì),太(tài)晚就来不及了。

03

AIGC下一站除了视频,还有(yǒu)远方

技术都是有(yǒu)两面性的,潜在(zài)的危害并不能(néng)掩盖其光辉的贡献。现在看来,人工智能技术(shù)将是(shì)第四次工业革命的核心驱动力量,将创造新的增长奇迹。

过去(qù)一年,人工智(zhì)能在(zài)技术(shù)和商业层面都(dōu)有了巨大进展(zhǎn),AI绘画就是人工(gōng)智能(néng)技术发(fā)生(shēng)方向性改变的一个代表。其下一站或许就(jiù)是视频(pín)。

此前,Meta和谷歌先后发(fā)布了(le)几条(tiáo)引爆科技圈的短视频。这些视(shì)频引发关注并非内(nèi)容做得多优秀,反而都(dōu)非常简单,比如一匹正在喝(hē)水的马,一只画画的玩具熊(xióng),或(huò)者一段骑(qí)摩(mó)托车的第一视角录像(xiàng),随便(biàn)一个有手机的人都可(kě)以随手录下(xià)一段。

ChatGPT之后又(yòu)一应用杀疯了,AIGC或(huò)进入可控期,将(jiāng)洗(xǐ)牌科技行业?_黑料(liào)正(zhèng)能量

但(dàn)这些短视频的创作(zuò)方(fāng)式非(fēi)常(cháng)简单,创作者仅仅需(xū)要向AI输入一段(duàn)话,甚至(zhì)只是(shì)说一下要(yào)求,AI就(jiù)可以根据需要生(shēng)成一段视频。

谷歌发布(bù)的两(liǎng)个AI生成视(shì)频分别(bié)来(lái)自于Imagen Video和Phenaki,前者(zhě)主要(yào)突出(chū)的是高清,与Meta的Make-A-Video没有太多(duō)的差别。

在Make-A-Video公(gōng)布了AI生成的视频后,AI圈就已经玩了一波梗,一个能够做出(chū)更高(gāo)清视频(pín)的AI还(hái)不足以在短时间内戳中兴(xīng)奋点。

Phenaki更加令人震惊的地方在(zài)于(yú),它(tā)可(kě)以制作(zuò)出超过2分钟的连贯的(de)也有确切内容的视(shì)频,这(zhè)才是(shì)真正(zhèng)让人们(men)感到惊(jīng)喜的地方。因为无论AI生成(chéng)的视频多么(me)高清,也只能是为内容生产者提供一个灵感(gǎn),一个素材(cái),一个过(guò)场动(dòng)画。

不过能够(gòu)制作出有具体剧情内容的视频就意味(wèi)着,一些视(shì)频创作由(yóu)AI代替人工完成已经初步有了可能。

当下AI的(de)发展速度(dù)已经(jīng)超过大部(bù)分人的想象。内容产业(yè)的本质是供给(gěi)创造需求,AIGC作为全(quán)新的(de)内(nèi)容(róng)生产方式(shì),可以为内(nèi)容产业带来更新的内容风(fēng)格、更快(kuài)的(de)生产(chǎn)速(sù)度(dù),更(gèng)低(dī)的生产成本(běn),这无疑(yí)会驱动内容产业的大爆发(fā)。

除了AI绘图、视(shì)频,AIGC技术(shù)还能应用于音乐、代码、机器(qì)人动作(zuò)等(děng)多(duō)种内容形(xíng)式的生成。不难(nán)发现该项技(jì)术(shù)不仅在游戏等行业能得到有效应(yīng)用,对于下一代互(hù)联网(wǎng)各(gè)种元素的构建(jiàn)亦(yì)有关(guān)键意(yì)义。

从商业化(huà)的角度来看(kàn),文化娱乐、教育、传媒等诸多领域,本身就(jiù)对(duì)基于AI的可视(shì)化内容有强(qiáng)烈需求(qiú)。

因(yīn)此,AI绘(huì)画及视(shì)频或不是结果,而(ér)只是AI进程中的一块重(zhòng)要拼图,有望(wàng)在(zài)技术更新的加持下实现更大的应用价值。

AI从(cóng)理解内(nèi)容,走向了可以生成(chéng)内(nèi)容(róng),甚至能够创(chuàng)造出独立价值和独立视角的内容。AIGC的(de)再次(cì)出(chū)圈,更代表着未(wèi)来的(de)先进生产力即将(jiāng)到来。

ChatGPT之后又(yòu)一应(yīng)用杀疯了,AIGC或进入(rù)可(kě)控(kòng)期,将洗牌科技(jì)行业?_黑(hēi)料(liào)正能量

04

紧抓(zhuā)大模型与(yǔ)算力(lì),牢(láo)固AIGC底(dǐ)座

从技术的(de)发(fā)展(zhǎn)也(yě)可以看出,在(zài)语言大模型、图像大模型之后,多模(mó)态大模(mó)型已经成为了新的(de)趋势。

大模型被誉为(wèi)当(dāng)前(qián)人工智能发展的智能底(dǐ)座,是全球竞争最激烈的(de)研究方(fāng)向(xiàng)之(zhī)一,包括(kuò)谷歌、亚马逊、百度、阿里、腾讯等众多头(tóu)部企业都在竞相发力。

不过(guò)训练大模型(xíng)的确价格(gé)不菲,以国盛证券发布的(de)《ChatGPT需(xū)要(yào)多少算力》报告估算,GPT-3训练一次的成本约为140万美元。而对(duì)于一些更大的LLM(大型语言模(mó)型),训练成本则介(jiè)于200万美元至1200万美元(yuán)高价之间。

以ChatGPT在(zài)2023年1月的独立访客(kè)平均数1300万(wàn)计算,其对应(yīng)芯片需求为(wèi)3万多片英伟达A100 GPU,初始投入(rù)成本约为8亿(yì)美(měi)元,每日(rì)仅电费(fèi)就在5万(wàn)美元左右(yòu)。

ChatGPT之后又一应用杀疯(fēng)了,AIGC或进入(rù)可控(kòng)期,将洗牌科(kē)技行业?_黑料正能量

此外不论是ChatGPT还是AIGC,都(dōu)离不开庞大算(suàn)力支持。在关注各类大模型的发(fā)展同(tóng)时,更(gèng)应(yīng)该关注算力(lì)网络的建设。

算力(lì)网络(luò)正驱动AI产业发展(zhǎn)进入史诗(shī)级(jí)加速进程(chéng),让(ràng)AIGC及通用(yòng)AI这一(yī)人(rén)工智能发展的终极目标离得更近(jìn)。

因为算(suàn)力可以对(duì)突破性(xìng)技(jì)术创新提供大力(lì)的支(zhī)持。这方面,多模态大模型是(shì)典型。作为(wèi)面(miàn)向未(wèi)来强人工智能(néng)、通用人工智(zhì)能的重要技术创(chuàng)新(xīn),多模(mó)态(tài)大模型已经在人工智能领域提(tí)出(chū)了很(hěn)多年,业界也有不少(shǎo)技术突(tū)破,但是,多模态大(dà)模型(xíng)进一(yī)步往下走,算(suàn)力需求呈几(jǐ)何式上升,一般的算力基础设施很快将(jiāng)难以胜任。

从(cóng)图像、文字(zì)、语音单独一项的(de)训练,到(dào)双模态、三模态(tài)的跃迁,让人工智(zhì)能可以灵活应对不同模(mó)态的转(zhuǎn)化、像(xiàng)人与世界交互一样自然,这方面,由算力(lì)网络来驱动将(jiāng)有明(míng)显优势。

ChatGPT之后又一(yī)应用杀疯了,AIGC或进入可控期,将洗牌科技行(xíng)业?_黑料正能(néng)量

此外(wài),还(hái)有(yǒu)很多需要爆发式增长的算力来支(zhī)撑的技术(shù)创(chuàng)新(xīn),将在人工智能算力网络支撑下(xià)快速推(tuī)进。

AIGC已经露出(chū)曙光,期(qī)待(dài)在大模型和大算力的(de)支持下AIGC能持(chí)续颠覆内容生产的(de)方式,将创造的边际(jì)成本降低,让万众受益。

未经允许不得转载:绿茶通用站群 表示第一的词语四字,古代表示第一的词语

评论

5+2=