绿茶通用站群绿茶通用站群

一厢情愿是什么意思

一厢情愿是什么意思 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机器人ChatGPT火爆以来,微软公(gōng)司(sī)创始人比(bǐ)尔·盖(gài)茨已多次公开谈论人(rén)工(gōng)智(zhì)能话题。在最近的(de)一次(cì)采访中(zhōng),他(tā)再次表示:“AI可能会让(ràng)科(kē)技行业迎来(lái)一次剧烈的洗牌”。

这(zhè)个结论是他在当(dāng)地时间(jiān)2月20日(rì)接受(shòu)《In Good Company》节目专访时提出的。

他预期,AI的发展可能会威胁到谷歌的市占率,因(yīn)为微软(ruǎn)在AI方面(miàn)的(de)行动(dòng)相当迅(xùn)速。而最终科技巨头(tóu)将把(bǎ)AI整(zhěng)合(hé)成用(yòng)户的(de)“全能助(zhù)手”,包揽一切(qiè)应(yīng)用,与人们进行沟通并提供建议(yì),可以取代亚(yà)马逊、Siri或Outlook等(děng)应(yīng)用。

大佬口中全能(néng)助手(shǒu)的(de)到(dào)来可能(néng)尚需时日,但由ControlNet引发的又一(yī)次AI绘(huì)画浪潮,让AIGC在ChatGPT的话题热点包围中杀出(chū)重(zhòng)围(wéi)。

ChatGPT之后又一应用杀疯(fēng)了,AIGC或进入可控(kòng)期,将洗(xǐ)牌科(kē)技行(xíng)业?_黑料(liào)正能量

01

ControlNet颠(diān)覆AI绘(huì)画新玩(wán)法

AIGC向(xiàng)可控靠近

以AI绘画为代表的(de)AIGC上一次爆火的时候,还是2022年(nián)8月,在(zài)美国科罗拉多州举办的(de)新兴数字艺(yì)术家(jiā)竞赛中,一幅名为《太空歌剧院》的作(zuò)品获(huò)奖。

随后各大厂(chǎng)商的AI绘画软件被广(guǎng)大网友熟知并体(tǐ)验,Stable Diffusion便是其(qí)中代(dài)表。

ChatGPT之后又一应(yīng)用杀(shā)疯了,AIGC或进入可控期,将洗牌科(kē)技行业?_黑料正能量

用(yòng)户(hù)们可(kě)以(yǐ)在应用中输入一(yī)组关键词(cí)或(huò)者(zhě)一张照片,就能获得一幅AI创作的(de)画作。

作画(huà)的关键(jiàn)就是所输(shū)入的文本。同一组关键词也可(kě)以创作出很多(duō)张风格不一样的画(huà)作,这(zhè)让创作的过程就像开盲盒。

很(hěn)多用户很喜(xǐ)欢这种不确定的惊喜,他们(men)会将生成(chéng)的(de)美(měi)图(tú)当做(zuò)头像(xiàng)。而另一部分喜(xǐ)欢翻(fān)看AI绘画的“翻车”作品。在社交媒(méi)体(tǐ)上,许多用(yòng)户分(fēn)享AI“翻车现(xiàn)场”,例(lì)如,一(yī)位网友的小狗照(zhào)片被(bèi)AI画成(chéng)了“肌肉男”,还(hái)有网友的(de)个人(rén)照(zhào)片(piàn)被AI识别成了建(jiàn)筑。

而如(rú)今随着ControlNet的出(chū)现(xiàn)与加(jiā)持,以往AI绘画的填写关键词(cí)游戏可能要被颠覆了(le)。

ChatGPT之后又一应用(yòng)杀疯了(le),AIGC或进入可控期,将洗牌科(kē)技行业?_黑(hēi)料正能(néng)量

ControlNet是一位(wèi)正在(zài)斯(sī)坦(tǎn)福读博的中(zhōng)国人张吕(lǚ)敏创作(zuò)的一种基(jī)于控制点的图像变形算法,主要用于数字图像(xiàng)处(chù)理、计算机视觉和计算机图形学等领域。

其SD插件一经发(fā)布,在短(duǎn)短的两天内便成(chéng)为了(le)AI绘(huì)画领域最(zuì)新(xīn)的热点。

在此(cǐ)之前,大家用了很多方法想让AI生成的结果尽可(kě)能的符(fú)合要(yào)求,但是都不(bù)尽(jǐn)如人意,它的出(chū)现(xiàn)代表着AI生成开始(shǐ)进入真正的可(kě)控时期。

因为(wèi)ControlNet可以直接提取画面的构图,人物的姿势和画面的深度(dù)信息(xī)等。有了它(tā)的帮助,就(jiù)不用频繁(fán)的(de)用提示词来碰运(yùn)气,抽盲盒式的创作了。

通俗的说ControlNet相当(dāng)于给(gěi)AI绘画(huà)加了“魔法”,不(bù)少博主的作品(pǐn)已经获得了大量的(de)浏(liú)览量(liàng),“viggo”就是其中之(zhī)一,他用朋友(yǒu)的照(zhào)片(piàn)直接带(dài)她们走(zǒu)进动漫世界。

ChatGPT之后(hòu)又一应用杀疯(fēng)了,AIGC或进(jìn)入(rù)可控期,将洗(xǐ)牌科(kē)技行业?_黑料正能量

viggo先用StableDiffusion图片转(zhuǎn)文(wén)字。

再(zài)用Text2Prompt插件拓展找到对应的关键词;最(zuì)后(hòu)用ControlNet插件绑定(dìng)骨骼开始(shǐ)换关键词试(shì)效果。

ChatGPT之(zhī)后又一(yī)应用杀疯了,AIGC或进入(rù)可控期(qī),将洗牌(pái)科技行业?_黑(hēi)料正能(néng)量

通过图片(piàn)就可以看出来,效(xiào)果(guǒ)十(shí)分惊艳。

ChatGPT之后(hòu)又一(yī)应(yīng)用(yòng)杀疯了,AIGC或进入可控(kòng)期,将洗牌(pái)科技行业(yè)?_黑(hēi)料正(zhèng)能量

ChatGPT之(zhī)后又一应用杀疯(fēng)了,AIGC或进入可控期,将洗牌科(kē)技(jì)行业(yè)?_黑料正能量

更厉(lì)害的(de)是,除了真实的(de)照片(piàn),草图也(yě)可以(yǐ)加(jiā)上“魔法”,知乎大牛“DevPoint”和“逗砂”介绍(shào)到(dào)ControlNet还能实(shí)现(xiàn)线(xiàn)稿(gǎo)转全彩图。大神张吕敏(mǐn)其本(běn)尊也亲自回应。

ChatGPT之后又一(yī)应用杀疯了,AIGC或(huò)进入可(kě)控期(qī),将洗(xǐ)牌(pái)科技行业?_黑料正能(néng)量

不得不说(shuō)当下AIGC已经变得越来越强大,甚至输出的作(zuò)品都(dōu)已经能以假乱真了。

02

难辨虚实,AIGC技术力爆发

警惕安全问题

近日,“苏州金鸡湖有游艇party”的消息火(huǒ)遍网络,而(ér)经(jīng)过警(jǐng)方辟谣这所谓的“party”可能是全国(guó)第一起AI绘(huì)图诈骗(piàn)。

由于这个活动里面给(gěi)出的(de)美(měi)女照片都(dōu)是AI制(zhì)作的真人照片绘图,因为太(tài)逼真,被大(dà)家当(dāng)成真事传播了

ChatGPT之后又一应用杀疯了,AIGC或进入(rù)可控期,将洗牌科技行业(yè)?_黑料正能量

不过仔(zǎi)细观察可(kě)以(yǐ)发现(xiàn),活动发(fā)起者(zhě)提供(gōng)的照片(piàn)中有个很大的漏(lòu)洞可以(yǐ)发现并非真人,而是AI绘(huì)图,那便是图片中(zhōng)女(nǚ)性(xìng)的手指(zhǐ)部分有的(de)存在异常。

ChatGPT之后又一应用(yòng)杀疯(fēng)了,AIGC或进入可控期,将(jiāng)洗牌科技行业?_黑料正能量

有行业人事表示:“现在因为手指部分的绘(huì)画算法(fǎ)比(bǐ)较(jiào)复杂,AI还不太会画人的手(shǒu),但最新(xīn)看到的(de)图(tú)片已经有越来越完美的AI模(mó)型出现(xiàn),以(yǐ)后可能就(jiù)完全(quán)没有漏洞(dòng)了。

类似的AI作图(tú)诈(zhà)骗在(zài)国外(wài)也(yě)已(yǐ)有发生。据英国广(guǎng)播公司报(bào)道,土(tǔ)耳(ěr)其地震期间,有Tiktok用(yòng)户使(shǐ)用AI合成了儿童受灾的假照片(piàn)发布到网络,以(yǐ)此诱(yòu)骗(piàn)善良的(de)人(rén)打赏“捐助(zhù)”从而实施诈骗。

目前(qián)随着技(jì)术发(fā)展,AIGC已(yǐ)经能做出真人照片般的绘图(tú)效果,如果这样的图(tú)片被用来(lái)诈骗(piàn),将非(fēi)一厢情愿是什么意思常可怕。

此(cǐ)外AIGC还引发了很多担忧,一方(fāng)面,批判者认为AI在“学习”了(le)大量前人的(de)作品之后(hòu),其(qí)创作(zuò)没(méi)有任(rèn)何情绪和灵魂,难以和人类的艺术创作相提并论。

另一方面,AIGC背后的版权、目前(qián)都并(bìng)没有得到有效的解决,还有(yǒu)AIGC会不会代替人类“至高无(wú)上”的创意(yì)。

马(mǎ)斯克也强调(diào),人工智能的安(ān)全问题需(xū)要得到重视,太晚就来不及了。

03

AIGC下(xià)一站除了视频(pín),还有远(yuǎn)方

技术都是有两面性的,潜(qián)在(zài)的危害(hài)并(bìng)不(bù)能掩盖其光辉的贡献(xiàn)。现在(zài)看来(lái),人(rén)工(gōng)智(zhì)能技术将是第四次(cì)工业革命的核心(xīn)驱动力量(liàng),将创造(zào)新的增长奇迹。

过(guò)去(qù)一年(nián),人工智(zhì)能在技术和商业(yè)层面都有(yǒu)了(le)巨大进展,AI绘画就是人(rén)工(gōng)智能(néng)技术发生方向性改变的一个代(dài)表。其(qí)下(xià)一站或许(xǔ)就是(shì)视频。

此前,Meta和谷(gǔ)歌(gē)先后发(fā)布了几(jǐ)条引(yǐn)爆科技(jì)圈(quān)的短视频。这些视频引发关注并非内容做得多优秀,反而都(dōu)非常(cháng)简(jiǎn)单,比如一匹正(zhèng)在喝水的马,一只(zhǐ)画画的玩具(jù)熊,或者一段骑摩托车的(de)第一视角(jiǎo)录(lù)像(xiàng),随便一个有手(shǒu)机的人都可以随手录下一段(duàn)。

ChatGPT之后又一应用杀(shā)疯(fēng)了,AIGC或(huò)进入可(kě)控期,将洗牌科技行业?_黑料(liào)正能量(liàng)

但这些短视频(pín)的创作方式非(fēi)常简单,创作者仅(jǐn)仅(jǐn)需要向(xiàng)AI输入一段话,甚至只是说(shuō)一下要求,AI就可(kě)以根据(jù)需要生(shēng)成一段视频。

谷(gǔ)歌(gē)发布的(de)两个AI生成(chéng)视频分别来自于Imagen Video和(hé)Phenaki,前者主要突出的(de)是高(gāo)清,与Meta的Make-A-Video没有太(tài)多(duō)的差(chà)别(bié)。

在Make-A-Video公布(bù)了AI生成(chéng)的视频后,AI圈就已(yǐ)经(jīng)玩了(le)一波梗,一个(gè)能够做出更高清视频(pín)的(de)AI还不足以(yǐ)在短时间内戳中兴奋点。

Phenaki更(gèng)加令人(rén)震惊(jīng)的地方(fāng)在于(yú),它可(kě)以制作出超过2分钟的连贯的也有(yǒu)确切内容的(de)视频,这才是真正(zhèng)让人们(men)感到惊喜的地方。因为无论(lùn)AI生成的视频多么高清,也只能是为内(nèi)容(róng)生产者(zhě)提供一个(gè)灵(líng)感,一个素材,一个(gè)过场(chǎng)动画。

不(bù)过(guò)能(néng)够制(zhì)作出有具(jù)体剧情内容(róng)的视频就(jiù)意味着,一些(xiē)视频创作由AI代(dài)替人工(gōng)完成已(yǐ)经初步有了可能。

当下AI的发(fā)展速度(dù)已经超过大部分人的(de)想象。内容(róng)产业的本质是(shì)供给(gěi)创造需求,AIGC作为全新的内(nèi)容生产方式,可以为内容(róng)产业带来(lái)更新的内容风格、更快的生产速度,更低的生产成(chéng)本,这无疑会驱动内容产(chǎn)业的大爆发。

除了AI绘(huì)图、视频,AIGC技(jì)术还能应用于音乐、代码、机器人动作(zuò)等多种内容形式的生成。不难发(fā)现(xiàn)该项技(jì)术(shù)不仅(jǐn)在游戏等行业能得到(dào)有(yǒu)效(xiào)应(yīng)用,对(duì)于下一代互(hù)联(lián)网(wǎng)各种元素(sù)的构建亦(yì)有关(guān)键意义。

从(cóng)商业化的(de)角度(dù)来看,文化娱(yú)乐、教(jiào)育、传媒等诸(zhū)多领域,本身就对基于(yú)AI的可视化内(nèi)容(róng)有强(qiáng)烈需(xū)求。

因此,AI绘画(huà)及视频或不是结果,而(ér)只是AI进(jìn)程中的一块(kuài)重要(yào)拼图(tú),有望在(zài)技(jì)术更新的加持下实(shí)现更大的应(yīng)用(yòng)价值。

AI从理解内容,走向(xiàng)了(le)可以生成内容,甚至能够创造出独立价(jià)值和独立视角的内容。AIGC的再次出(chū)圈,更代表着(zhe)未来的先进生产(chǎn)力即(jí)将到(dào)来(lái)。

ChatGPT之后又一应用杀疯(fēng)了,AIGC或进入(rù)可控期(qī),将洗牌(pái)科技行业?_黑料正能量

04

紧抓大模(mó)型与算力,牢固AIGC底座

从技术的发(fā)展也可以看(kàn)出(chū),在语(yǔ)言大模(mó)型、图(tú)像大模(mó)型之后(hòu),多模(mó)态大模(mó)型已(yǐ)经成为了新的趋势(shì)。

大模型被誉为当(dāng)前(qián)人(rén)工智能(néng)发展(zhǎn)的(de)智能(néng)底座,是(shì)全球竞争最激烈的研究方(fāng)向之一,包括谷(gǔ)歌(gē)、亚马(mǎ)逊、百(bǎi)度(dù)、阿里、腾讯等(děng)众多头部企业都在(zài)竞相发力。

不过(guò)训练大模(mó)型的确(què)价格不菲(fēi),以国盛证(zhèng)券发布的《ChatGPT需要多少算力》报告(gào)估(gū)算,GPT-3训练一次的成本(běn)约(yuē)为(wèi)140万美元。而对于(yú)一(yī)些(xiē)更大(dà)的LLM(大型语言(yán)模型),训(xùn)练成本(běn)则(zé)介于(yú)200万美(měi)元(yuán)至1200万美元高(gāo)价之间。

以ChatGPT在2023年1月的独立访客平均数1300万计算,其对(duì)应芯片需求为(wèi)3万多片英伟(wěi)达(dá)A100 GPU,初(chū)始投入成本约为8亿美元,每(měi)日仅电(diàn)费就在5万(wàn)美元左(zuǒ)右。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?_黑(hēi)料正能量

此外不论是ChatGPT还是AIGC,都离不(bù)开(kāi)庞大算力支持。在关注各类大模型的发展(zhǎn)同(tóng)时,更应该关(guān)注(zhù)算力网络的建设。

算力(lì)网络正(zhèng)驱动AI产业发展进入史(shǐ)诗级(jí)加速进程,让AIGC及通(tōng)用AI这(zhè)一人工智能(néng)发展的终极(jí)目(mù)标离得(dé)更近。

因为(wèi)算力(lì)可(kě)以对突破性技(jì)术创新提供大力的支(zhī)持(chí)。这方面,多模态大模型是典型(xíng)。作为(wèi)面向未来强(qiáng)人工智能、通用人工智能的重要技术创新,多模态(tài)大模型已(yǐ)经在人工智(zhì)能领域提(tí)出了(le)很多年,业界(jiè)也有不少技(jì)术(shù)突破(pò),但(dàn)是,多模态(tài)大模型进一步(bù)往下走(zǒu),算力需(xū)求呈几(jǐ)何(hé)式上升,一般(bān)的(de)算力(lì)基础设施很快(kuài)将难(nán)以胜(shèng)任。

从图像、文字(zì)、语音单独一项的训(xùn)练,到双模态、三(sān)模(mó)态的(de)跃(yuè)迁,让人(rén)工智能(néng)可以灵活应对不(bù)同模态的转化(huà)、像(xiàng)人(rén)与世界交互(hù)一样(yàng)自(zì)然,这方面,由算(suàn)力网(wǎng)络来驱动将有明显优势。

ChatGPT之后又一应用杀疯(fēng)了,AIGC或进入(rù)可控(kòng)期(qī),将洗牌科技行业?_黑<span style='color: #ff0000; line-height: 24px;'>一厢情愿是什么意思</span>(hēi)料正能量

此外,还(hái)有很多(duō)需要爆发式增(zēng)长的算力来支撑的技(jì)术创新,将在(zài)人工智能(néng)算力网络(luò)支(zhī)撑下快速推进(jìn)。

AIGC已经露(lù)出曙光,期待在大(dà)模(mó)型和大算力的支持下AIGC能持续(xù)颠覆内容生产的(de)方式,将创造的边际(jì)成本降(jiàng)低,让万众(zhòng)受益。

未经允许不得转载:绿茶通用站群 一厢情愿是什么意思

评论

5+2=