绿茶通用站群绿茶通用站群

十公分有多长 10厘米就是10公分吗

十公分有多长 10厘米就是10公分吗 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自(zì)聊天(tiān)机器(qì)人(rén)ChatGPT火爆(bào)以来,微软公司创始人比(bǐ)尔(ěr)·盖(gài)茨(cí)已(yǐ)多(duō)次公开谈论人工智能话(huà)题。在(zài)最近的一(yī)次采访中,他再次(cì)表示:“AI可能会让科技行业迎来一次剧烈的洗(xǐ)牌”。

这(zhè)个(gè)结论是他在当地时(shí)间2月20日接受《In Good Company》节目专访时提出的。

他预期(qī),AI的发展可能会威胁到(dào)谷歌的(de)市占率,因为微软在AI方面的行(xíng)动(dòng)相当(dāng)迅速。而最终(zhōng)科技巨(jù)头(tóu)将把AI整合成(chéng)用户的“全能助手(shǒu)”,包揽(lǎn)一切(qiè)应(yīng)用,与人们(men)进行沟(gōu)通(tōng)并提(tí)供建议,可以取代亚马逊、Siri或(huò)Outlook等应用。

大(dà)佬口中全(quán)能助手的到来可能尚(shàng)需时日,但(dàn)由ControlNet引发的又(yòu)一(yī)次AI绘画(huà)浪潮,让AIGC在ChatGPT的话题热点包围(wéi)中杀出重围(wéi)。

ChatGPT之后又一应用杀疯(fēng)了,AIGC或进入可控(kòng)期,将洗牌科技行(xíng)业?_黑料正能量(liàng)

01

ControlNet颠覆AI绘画(huà)新(xīn)玩法

AIGC向可控靠近

以AI绘画为(wèi)代表的AIGC上一次爆火(huǒ)的时(shí)候(hòu),还是2022年8月(yuè),在美(měi)国科罗拉多(duō)州(zhōu)举办的新兴数字艺术家竞赛中(zhōng),一幅名(míng)为《太空歌剧院》的(de)作(zuò)品获奖。

随后各大厂商(shāng)的AI绘画软件被广大网友(yǒu)熟(shú)知(zhī)并体验(yàn),Stable Diffusion便(biàn)是其中代表。

ChatGPT之后又一应(yīng)用杀疯了,AIGC或进入可控期,将洗牌科技行业?_黑料正(zhèng)能量

用户们可(kě)以在应用中输入一组关键(jiàn)词或者(zhě)一张照片,就能获得一幅AI创作的(de)画作。

作画的关键就是所输入的(de)文本。同一组关键词也可以创(chuàng)作(zuò)出很(hěn)多张风格不一(yī)样的画作,这让创(chuàng)作(zuò)的过(guò)程就像(xiàng)开盲盒。

很(hěn)多用户(hù)很喜(xǐ)欢这种不确(qu十公分有多长 10厘米就是10公分吗è)定(dìng)的惊喜(xǐ),他(tā)们会将(jiāng)生(shēng)成的美图当(dāng)做头像。而另(lìng)一部分喜欢翻看AI绘画的“翻车(chē)”作品。在社交媒体上(shàng),许多(duō)用户分享AI“翻车现场”,例如,一位网友的小狗照片被AI画成了(le)“肌(jī)肉男”,还有网(wǎng)友的个(gè)人(rén)照片被AI识别成(chéng)了建筑。

而(ér)如(rú)今随着ControlNet的出现与加(jiā)持,以往AI绘画的填写(xiě)关(guān)键词游戏可能要被颠覆了(le)。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期(qī),将洗牌(pái)科技行业?_黑料正能量

ControlNet是一位正在斯坦福读博的中国(guó)人张(zhāng)吕(lǚ)敏(mǐn)创(chuàng)作(zuò)的一种基于控制(zhì)点的图像变(biàn)形(xíng)算法,主要用(yòng)于数字图像处(chù)理、计(jì)算机视觉(jué)和计(jì)算机图形学等领(lǐng)域。

其(qí)SD插件一(yī)经发布,在短短的两天内便成(chéng)为了AI绘画(huà)领域最新的热点。

在此(cǐ)之前,大家用了很多方法想让AI生成(chéng)的结果尽可能的符合(hé)要求,但(dàn)是都不尽如人意,它的出现(xiàn)代(dài)表(biǎo)着AI生(shēng)成开始(shǐ)进(jìn)入真正的可控时期。

因为ControlNet可以直接提取画面的构图,人物的姿势(shì)和画面的深度信息等(děng)。有了(le)它(tā)的帮助,就不(bù)用(yòng)频繁的用提示词来碰运气(qì),抽盲盒式的创作了。

通俗的说(shuō)ControlNet相当于(yú)给AI绘画加了(le)“魔法”,不少博(bó)主的作品已经(jīng)获(huò)得了(le)大(dà)量的(de)浏(liú)览量,“viggo”就是(shì)其中之一(yī),他用朋友(yǒu)的照片直接带(dài)她们走进动(dòng)漫世界。

ChatGPT之后(hòu)又(yòu)一应(yīng)用杀疯了,AIGC或(huò)进入可控期,将洗牌科技行业(yè)?_黑(hēi)料(liào)正(zhèng)能量

viggo先(xiān)用StableDiffusion图片(piàn)转文字。

再用Text2Prompt插件拓展找(zhǎo)到对(duì)应(yīng)的关键词;最后(hòu)用ControlNet插件绑(bǎng)定骨(gǔ)骼开始换(huàn)关键词试(shì)效(xiào)果。

ChatGPT之后(hòu)又一应用杀疯了(le),AIGC或进入可控(kòng)期,将洗(xǐ)牌科技行业?_黑料正能(néng)量

通过图片就可(kě)以看出(chū)来,效果十分惊艳。

ChatGPT之(zhī)后又一应(yīng)用(yòng)杀疯了,AIGC或进(jìn)入(rù)可控期(qī),将洗(xǐ)牌(pái)科技行业?_黑(hēi)料正能量

ChatGPT之后又一应用杀疯了(le),AIGC或(huò)进(jìn)入可控期,将洗(xǐ)牌科技行(xíng)业?_黑料(liào)正能量(liàng)

更(gèng)厉害的是(shì),除了真实的照片,草图(tú)也可以加上“魔(mó)法”,知乎(hū)大牛“DevPoint”和(hé)“逗砂”介绍到(dào)ControlNet还能实现线稿转全彩图。大(dà)神张吕(lǚ)敏(mǐn)其本尊也亲自回应。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期(qī),将洗牌(pái)科(kē)技行业?_黑(hēi)料正(zhèng)能(néng)量

不得不说(shuō)当下AIGC已经(jīng)变得越来越强大,甚至输出的作品都已经能以假乱(luàn)真了。

02

难(nán)辨(biàn)虚实(shí),AIGC技术力(lì)爆发(fā)

警惕安全问(wèn)题

近日(rì),“苏州金(jīn)鸡湖(hú)有游艇party”的消息火遍网(wǎng)络,而(ér)经过(guò)警(jǐng)方辟谣这所谓的“party”可能是全国第一起AI绘图诈骗。

由于这个活动里(lǐ)面(miàn)给出的美(měi)女照片都(dōu)是AI制(zhì)作的真(zhēn)人(rén)照片绘(huì)图(tú),因为太(tài)逼真,被大(dà)家(jiā)当成真(zhēn)事传播(bō)了

ChatGPT之后(hòu)又一应(yīng)用(yòng)杀(shā)疯了,AIGC或进入可(kě)控期,将洗牌科技行业?_黑料(liào)正能量(liàng)

不过仔细观察(chá)可以发现,活动发起者提供的照片中(zhōng)有个很大(dà)的漏洞可(kě)以(yǐ)发(fā)现并(bìng)非真人(rén),而是AI绘图,那(nà)便(biàn)是(shì)图(tú)片(piàn)中女性的手指(zhǐ)部分有的存(cún)在异常(cháng)。

ChatGPT之(zhī)后又(yòu)一应用(yòng)杀疯了,AIGC或(huò)进入可控期,将洗(xǐ)牌科(kē)技(jì)行业(yè)?_黑料正能量(liàng)

有行业人事表示(shì):“现在因为(wèi)手指部分的绘画算法比较复杂,AI还不太会画人的(de)手,但最新(xīn)看(kàn)到的图片已经有越来越完美(měi)的AI模型出现(xiàn),以后可能就完全没有漏洞(dòng)了。

类似的AI作图诈骗(piàn)在(zài)国外(wài)也(yě)已有发生(shēng)。据英国广播公司(sī)报道,土(tǔ)耳其地震期间,有Tiktok用户使用AI合成了儿童受灾的(de)假照(zhào)片发布到网(wǎng)络(luò),以此诱骗善良的人打(dǎ)赏“捐助”从而(ér)实施诈骗。

目前(qián)随着技术发展,AIGC已经能做出真人照片般的绘图效果,如果这样的图片被用(yòng)来(lái)诈(zhà)骗(piàn),将非(fēi)常可怕。

此外AIGC还引(yǐn)发了很多担忧,一方面(miàn),批判(pàn)者认为AI在“学习”了(le)大量前人的作(zuò)品之(zhī)后,其(qí)创作(zuò)没有任何(hé)情绪(xù)和灵魂,难以和(hé)人类的艺(yì)术创作(zuò)相提(tí)并论。

另一(yī)方面,AIGC背后的版权、目(mù)前都并没有得到有(yǒu)效的(de)解决(jué),还有AIGC会不会代替人类“至高无(wú)上”的创意(yì)。

马斯克也强调,人工智能的安全问题需要(yào)得到重视,太晚就(jiù)来(lái)不(bù)及了。

03

AIGC下一站除了视(shì)频,还有远方

技术都是有两(liǎng)面(miàn)性的,潜在的(de)危害(hài)并不能掩(yǎn)盖其光辉的贡献。现在看来,人工智能(néng)技术(shù)将是第四次工业革(gé)命(mìng)的(de)核心驱动力(lì)量(liàng),将创造新的增长奇(qí)迹。

过去(qù)一(yī)年,人工智能在技术和商(shāng)业层面(miàn)都有了巨大进展,AI绘画就是(shì)人工智(zhì)能技(jì)术发(fā)生方向性改变的一个代表。其下(xià)一站或许就是(shì)视(shì)频。

此前,Meta和谷歌先后发布了几条引爆科(kē)技圈的(de)短(duǎn)视(shì)频。这些视(shì)频引发关注并非内容做得多优秀,反而都非(fēi)常简单,比如一(yī)匹正(zhèng)在喝水(shuǐ)的(de)马(mǎ),一只画画的玩具熊,或者一(yī)段骑摩托车的第一(yī)视角(jiǎo)录(lù)像,随便一(yī)个有(yǒu)手机的人都可以随手录下一段。

ChatGPT之后又一应用杀疯了,AIGC或进入(rù)可控(kòng)期,将洗牌科技行业?_黑(hēi)料正能量

但这些短视频的创(chuàng)作方式非常简单,创(chuàng)作者仅仅(jǐn)需要向AI输入一段话,甚至只是说一下要求,AI就(jiù)可以根据需要(yào)生成一(yī)段视(shì)频(pín)。

谷歌发布的两个AI生成视(shì)频分别来自(zì)于Imagen Video和(hé)Phenaki,前者主要突出(chū)的(de)是高清,与(yǔ)Meta的Make-A-Video没(méi)有太多(duō)的差别。

在(zài)Make-A-Video公(gōng)布(bù)了AI生(shēng)成的视频后,AI圈就已(yǐ)经(jīng)玩了(le)一波梗,一(yī)个能够(gòu)做出更高清视频的AI还不足以(yǐ)在短时间内戳中兴奋点。

Phenaki更(gèng)加令人震惊的地方(fāng)在于,它可以制作(zuò)出超过2分钟的连贯的也有确切内容(róng)的(de)视频,这(zhè)才是真(zhēn)正(zhèng)让人们感到惊(jīng)喜(xǐ)的地方(fāng)。因(yīn)为无(wú)论(lùn)AI生(shēng)成的视(shì)频(pín)多(duō)么高清,也只能是为内容生产者提(tí)供一(yī)个(gè)灵感(gǎn),一个(gè)素(sù)材,一个(gè)过场动画。

不过能够制作出有具体剧(jù)情内容(róng)的(de)视(shì)频就意味(wèi)着,一些视频(pín)创作由AI代替(tì)人工完成已经(jīng)初步有了(le)可能。

当下AI的(de)发展速度已经超过大部分人的想象。内(nèi)容产(chǎn)业的(de)本质是供给创造需求,AIGC作为全新的内(nèi)容生(shēng)产方式,可以为内容产业带来更新的内容风格(gé)、更快的生产(chǎn)速度,更低的生产(chǎn)成本,这无疑会驱动内容产(chǎn)业的(de)大爆(bào)发。

除了AI绘图(tú)、视频(pín),AIGC技术还能应用于音乐、代码、机器人动作(zuò)等多种内容(róng)形式的生成。不(bù)难发现该项技术(shù)不仅(jǐn)在游(yóu)戏等行(xíng)业能(néng)得到有效应用,对于(yú)下一(yī)代互联网各种元(yuán)素(sù)的构建(jiàn)亦有关键意义。

从(cóng)商业化的角度(dù)来看,文化娱乐(lè)、教(jiào)育、传媒等诸多领域,本身就(jiù)对基于(yú)AI的可视(shì)化内容有强烈(liè)需求。

因此(cǐ),AI绘画及视(shì)频或不是(shì)结果,而只是(shì)AI进程中(zhōng)的一块(kuài)重(zhòng)要拼图(tú),有望在技术更新的加持下实现更大的(de)应(yīng)用价(jià)值(zhí)。

AI从理解内容(róng),走向了(le)可以生成内容(róng),甚至能够创造出(chū)独立(lì)价值和独立视角的内(nèi)容(róng)。AIGC的再次出(chū)圈,更代表着未来的先(xiān)进生产力即将到来(lái)。

ChatGPT之后又(yòu)一(yī)应(yīng)用杀疯(fēng)了,AIGC或(huò)进(jìn)入可控期,将洗(xǐ)牌科技行业?_黑(hēi)料正能量

04

紧抓大(dà)模型与(yǔ)算力,牢固(gù)AIGC底座

从技(jì)术的发展也可(kě)以看出,在语言(yán)大(dà)模型(xíng)、图像大模型之(zhī)后,多模态大模型已经成为了新的趋势。

大模型被誉为当前人工智能发展的智能(néng)底座,是全球(qiú)竞争最(zuì)激烈的(de)研究方向之(zhī)一,包(bāo)括谷歌、亚(yà)马逊、百度、阿(ā)里、腾讯(xùn)等众多头部(bù)企业(yè)都在竞相发力(lì)。

不过训练大模型(xíng)的确(què)价(jià)格不菲,以国盛证券发布的《ChatGPT需要多少算(suàn)力》报(bào)告估算,GPT-3训(xùn)练一次的成本约(yuē)为140万美(měi)元。而对(duì)于一些更(gèng)大的LLM(大型语(yǔ)言模型),训练成本则介(jiè)于200万(wàn)美元至1200万(wàn)美元高价之间(jiān)。

以(yǐ)ChatGPT在2023年1月的独立访客平均数1300万计(jì)算,其对应(yīng)芯片需求为(wèi)3万多片(piàn)英伟达A100 GPU,初始投入(rù)成本约(yuē)为8亿美元,每日仅电费(fèi)就在5万美元(yuán)左(zuǒ)右(yòu)。

ChatGPT之后(hòu)又一(yī)应用杀疯(fēng)了,AIGC或进入可(kě)控期,将洗牌(pái)科技行业?_黑料正能(néng)量

此外不论(lùn)是ChatGPT还是(shì)AIGC,都(dōu)离(lí)不(bù)开庞(páng)大算力支持。在关注各类大模型的(de)发展同时,更应该关注算(suàn)力网络的(de)建设。

算力网络正驱动(dòng)AI产业发展进(jìn)入史诗级加速进程(chéng),让AIGC及(jí)通(tōng)用AI这(zhè)一(yī)人工智能(néng)发展的终(zhōng)极目(mù)标离得更近。

因为算力(lì)可以对突破性技术创(chuàng)新提供大力的支持。这方面,多模(mó)态大模型是典型。作为(wèi)面向未来强人工(gōng)智能、通用人工智能的重要技术创新(xīn),多模态大(dà)模(mó)型(xíng)已经在人工智(zhì)能领域提出了很多(duō)年,业界也(yě)有(yǒu)不少技术突破,但是,多(duō)模态大(dà)模型(xíng)进一步往(wǎng)下走,算(suàn)力需求呈几(jǐ)何式上升(shēng),一般的算力基础设施(shī)很快(kuài)将难以胜任。

从图像、文(wén)字、语音(yīn)单独一(yī)项的训(xùn)练,到双模(mó)态、三模态的跃迁,让人工(gōng)智能可以灵活应(yīng)对不(bù)同模态的转化、像(xiàng)人(rén)与(yǔ)世界交互一样自(zì)然,这(zhè)方面,由算力网络来(lái)驱动将有明显优势(shì)。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或(huò)进入可(kě)控期,将洗(xǐ)牌科技行业(yè)?_黑料(liào)正能量

此外(wài),还有很多(duō)需(xū)要爆发式增(zēng)长的算(suàn)力来(lái)十公分有多长 10厘米就是10公分吗支撑的技术创新,将在人工智能算力网络支撑下快速推进。

AIGC已经(jīng)露出曙光,期待在大模型和大(dà)算(suàn)力的支持下(xià)AIGC能(néng)持续(xù)颠覆内容生产的方式,将(jiāng)创造的边际成(chéng)本(běn)降低,让万众受益(yì)。

未经允许不得转载:绿茶通用站群 十公分有多长 10厘米就是10公分吗

评论

5+2=