一厢情愿是什么意思-绿茶通用站群

一厢情愿是什么意思 ChatGPT之后又一应用杀疯了，AIGC或进入可控期，将洗牌科技行业？

自聊天机器人ChatGPT火爆以来，微软公(gōng)司(sī)创始人比(bǐ)尔·盖(gài)茨已多次公开谈论人(rén)工(gōng)智(zhì)能话题。在最近的(de)一次(cì)采访中(zhōng)，他(tā)再次表示：“AI可能会让(ràng)科(kē)技行业迎来(lái)一次剧烈的洗牌”。

这(zhè)个结论是他在当(dāng)地时间(jiān)2月20日(rì)接受(shòu)《In Good Company》节目专访时提出的。

他预期，AI的发展可能会威胁到谷歌的市占率，因(yīn)为微软(ruǎn)在AI方面(miàn)的(de)行动(dòng)相当迅(xùn)速。而最终科技巨头(tóu)将把(bǎ)AI整(zhěng)合(hé)成用(yòng)户的(de)“全能助(zhù)手”，包揽一切(qiè)应(yīng)用，与人们进行沟通并提供建议(yì)，可以取代亚(yà)马逊、Siri或Outlook等(děng)应(yīng)用。

大佬口中全能(néng)助手(shǒu)的(de)到(dào)来可能(néng)尚需时日，但由ControlNet引发的又一(yī)次AI绘(huì)画浪潮，让AIGC在ChatGPT的话题热点包围中杀出(chū)重(zhòng)围(wéi)。

ChatGPT之后又一应用杀疯(fēng)了，AIGC或进入可控(kòng)期，将洗(xǐ)牌科(kē)技行(xíng)业？_黑料(liào)正能量

ControlNet颠(diān)覆AI绘(huì)画新玩(wán)法

AIGC向(xiàng)可控靠近

以AI绘画为代表的(de)AIGC上一次爆火的时候，还是2022年(nián)8月，在(zài)美国科罗拉多州举办的(de)新兴数字艺(yì)术家(jiā)竞赛中，一幅名为《太空歌剧院》的作(zuò)品获(huò)奖。

随后各大厂(chǎng)商的AI绘画软件被广(guǎng)大网友熟知并体(tǐ)验，Stable Diffusion便是其(qí)中代(dài)表。

用(yòng)户(hù)们可(kě)以(yǐ)在应用中输入一(yī)组关键词(cí)或(huò)者(zhě)一张照片，就能获得一幅AI创作的(de)画作。

作画(huà)的关键(jiàn)就是所输(shū)入的文本。同一组关键词也可(kě)以创作出很多(duō)张风格不一样的画(huà)作，这(zhè)让创作的过程就像开盲盒。

很(hěn)多用户很喜(xǐ)欢这种不确定的惊喜，他们(men)会将生成(chéng)的(de)美(měi)图(tú)当做(zuò)头像(xiàng)。而另一部分喜(xǐ)欢翻(fān)看AI绘画的“翻车”作品。在社交媒(méi)体(tǐ)上，许多用(yòng)户分(fēn)享AI“翻车现(xiàn)场”，例(lì)如，一(yī)位网友的小狗照(zhào)片被(bèi)AI画成(chéng)了“肌肉男”，还(hái)有网友的(de)个人(rén)照(zhào)片(piàn)被AI识别成了建(jiàn)筑。

而如(rú)今随着ControlNet的出(chū)现(xiàn)与加(jiā)持，以往AI绘画的填写关键词(cí)游戏可能要被颠覆了(le)。

ControlNet是一位(wèi)正在(zài)斯(sī)坦(tǎn)福读博的中(zhōng)国人张吕(lǚ)敏创作(zuò)的一种基(jī)于控制点的图像变形算法，主要用于数字图像(xiàng)处(chù)理、计算机视觉和计算机图形学等领域。

其SD插件一经发(fā)布，在短(duǎn)短的两天内便成(chéng)为了(le)AI绘(huì)画领域最(zuì)新(xīn)的热点。

在此(cǐ)之前，大家用了很多方法想让AI生成的结果尽可(kě)能的符(fú)合要(yào)求，但是都不(bù)尽(jǐn)如人意，它的出(chū)现(xiàn)代表着AI生成开始(shǐ)进入真正的可(kě)控时期。

因为(wèi)ControlNet可以直接提取画面的构图，人物的姿势和画面的深度(dù)信息(xī)等。有了它(tā)的帮助，就(jiù)不用频繁(fán)的(de)用提示词来碰运(yùn)气，抽盲盒式的创作了。

通俗的说ControlNet相当(dāng)于给(gěi)AI绘画(huà)加了“魔法”，不(bù)少博主的作品(pǐn)已经获得了大量的(de)浏(liú)览量(liàng)，“viggo”就是其中之(zhī)一，他用朋友(yǒu)的照(zhào)片(piàn)直接带(dài)她们走(zǒu)进动漫世界。

viggo先用StableDiffusion图片转(zhuǎn)文(wén)字。

再(zài)用Text2Prompt插件拓展找到对应的关键词；最(zuì)后(hòu)用ControlNet插件绑定(dìng)骨骼开始(shǐ)换关键词试(shì)效果。

通过图片(piàn)就可以看出来，效(xiào)果(guǒ)十(shí)分惊艳。

更厉(lì)害的(de)是，除了真实的(de)照片(piàn)，草图也(yě)可以(yǐ)加(jiā)上“魔法”，知乎大牛“DevPoint”和“逗砂”介绍(shào)到(dào)ControlNet还能实(shí)现(xiàn)线(xiàn)稿(gǎo)转全彩图。大神张吕敏(mǐn)其本(běn)尊也亲自回应。

不得不说(shuō)当下AIGC已经变得越来越强大，甚至输出的作(zuò)品都(dōu)已经能以假乱真了。

难辨虚实，AIGC技术力爆发

警惕安全问题

近日，“苏州金鸡湖有游艇party”的消息火(huǒ)遍网络，而(ér)经(jīng)过警(jǐng)方辟谣这所谓的“party”可能是全国(guó)第一起AI绘(huì)图诈骗(piàn)。

由于这个活动里面给(gěi)出的(de)美(měi)女照片都(dōu)是AI制(zhì)作的真人照片绘图，因为太(tài)逼真，被大(dà)家当(dāng)成真事传播了。

不过仔(zǎi)细观察可(kě)以(yǐ)发现(xiàn)，活动发(fā)起者(zhě)提供(gōng)的照片(piàn)中有个很大的漏(lòu)洞可以(yǐ)发现并非真人，而是AI绘(huì)图，那便是图片中(zhōng)女(nǚ)性(xìng)的手指(zhǐ)部分有的(de)存在异常。

ChatGPT之后又一应用(yòng)杀疯(fēng)了，AIGC或进入可控期，将(jiāng)洗牌科技行业？_黑料正能量

有行业人事表示：“现在因为手指部分的绘(huì)画算法(fǎ)比(bǐ)较(jiào)复杂，AI还不太会画人的手(shǒu)，但最新(xīn)看到的(de)图(tú)片已经有越来越完美的AI模(mó)型出现(xiàn)，以(yǐ)后可能就(jiù)完全(quán)没有漏洞(dòng)了。”

类似的AI作图(tú)诈(zhà)骗在(zài)国外(wài)也(yě)已(yǐ)有发生。据英国广(guǎng)播公司报(bào)道，土(tǔ)耳(ěr)其地震期间，有Tiktok用(yòng)户使(shǐ)用AI合成了儿童受灾的假照片(piàn)发布到网络，以(yǐ)此诱(yòu)骗(piàn)善良的(de)人(rén)打赏“捐助(zhù)”从而实施诈骗。

目前(qián)随着技(jì)术发(fā)展，AIGC已(yǐ)经能做出真人照片般的绘图(tú)效果，如果这样的图(tú)片被用来(lái)诈骗(piàn)，将非(fēi)一厢情愿是什么意思常可怕。

此(cǐ)外AIGC还引发了很多担忧，一方(fāng)面，批判者认为AI在“学习”了(le)大量前人的(de)作品之后(hòu)，其(qí)创作(zuò)没(méi)有任(rèn)何情绪和灵魂，难以和人类的艺术创作相提并论。

另一方面，AIGC背后的版权、目前(qián)都并(bìng)没有得到有效的解决，还有(yǒu)AIGC会不会代替人类“至高无(wú)上”的创意(yì)。

马(mǎ)斯克也强调(diào)，人工智能的安(ān)全问题需(xū)要得到重视，太晚就来不及了。

AIGC下(xià)一站除了视频(pín)，还有远(yuǎn)方

技术都是有两面性的，潜(qián)在(zài)的危害(hài)并(bìng)不(bù)能掩盖其光辉的贡献(xiàn)。现在(zài)看来(lái)，人(rén)工(gōng)智(zhì)能技术将是第四次(cì)工业革命的核心(xīn)驱动力量(liàng)，将创造(zào)新的增长奇迹。

过(guò)去(qù)一年(nián)，人工智(zhì)能在技术和商业(yè)层面都有(yǒu)了(le)巨大进展，AI绘画就是人(rén)工(gōng)智能(néng)技术发生方向性改变的一个代(dài)表。其(qí)下(xià)一站或许(xǔ)就是(shì)视频。

此前，Meta和谷(gǔ)歌(gē)先后发(fā)布了几(jǐ)条引(yǐn)爆科技(jì)圈(quān)的短视频。这些视频引发关注并非内容做得多优秀，反而都(dōu)非常(cháng)简(jiǎn)单，比如一匹正(zhèng)在喝水的马，一只(zhǐ)画画的玩具(jù)熊，或者一段骑摩托车的(de)第一视角(jiǎo)录(lù)像(xiàng)，随便一个有手(shǒu)机的人都可以随手录下一段(duàn)。

但这些短视频(pín)的创作方式非(fēi)常简单，创作者仅(jǐn)仅(jǐn)需要向(xiàng)AI输入一段话，甚至只是说(shuō)一下要求，AI就可(kě)以根据(jù)需要生(shēng)成一段视频。

谷(gǔ)歌(gē)发布的(de)两个AI生成(chéng)视频分别来自于Imagen Video和(hé)Phenaki，前者主要突出的(de)是高(gāo)清，与Meta的Make-A-Video没有太(tài)多(duō)的差(chà)别(bié)。

在Make-A-Video公布(bù)了AI生成(chéng)的视频后，AI圈就已(yǐ)经(jīng)玩了(le)一波梗，一个(gè)能够做出更高清视频(pín)的(de)AI还不足以(yǐ)在短时间内戳中兴奋点。

Phenaki更(gèng)加令人(rén)震惊(jīng)的地方(fāng)在于(yú)，它可(kě)以制作出超过2分钟的连贯的也有(yǒu)确切内容的(de)视频，这才是真正(zhèng)让人们(men)感到惊喜的地方。因为无论(lùn)AI生成的视频多么高清，也只能是为内(nèi)容(róng)生产者(zhě)提供一个(gè)灵(líng)感，一个素材，一个(gè)过场(chǎng)动画。

不(bù)过(guò)能(néng)够制(zhì)作出有具(jù)体剧情内容(róng)的视频就(jiù)意味着，一些(xiē)视频创作由AI代(dài)替人工(gōng)完成已(yǐ)经初步有了可能。

当下AI的发(fā)展速度(dù)已经超过大部分人的(de)想象。内容(róng)产业的本质是(shì)供给(gěi)创造需求，AIGC作为全新的内(nèi)容生产方式，可以为内容(róng)产业带来(lái)更新的内容风格、更快的生产速度，更低的生产成(chéng)本，这无疑会驱动内容产(chǎn)业的大爆发。

除了AI绘(huì)图、视频，AIGC技(jì)术还能应用于音乐、代码、机器人动作(zuò)等多种内容形式的生成。不难发(fā)现(xiàn)该项技(jì)术(shù)不仅(jǐn)在游戏等行业能得到(dào)有(yǒu)效(xiào)应(yīng)用，对(duì)于下一代互(hù)联(lián)网(wǎng)各种元素(sù)的构建亦(yì)有关(guān)键意义。

从(cóng)商业化的(de)角度(dù)来看，文化娱(yú)乐、教(jiào)育、传媒等诸(zhū)多领域，本身就对基于(yú)AI的可视化内(nèi)容(róng)有强(qiáng)烈需(xū)求。

因此，AI绘画(huà)及视频或不是结果，而(ér)只是AI进(jìn)程中的一块(kuài)重要(yào)拼图(tú)，有望在(zài)技(jì)术更新的加持下实(shí)现更大的应(yīng)用(yòng)价值。

AI从理解内容，走向(xiàng)了(le)可以生成内容，甚至能够创造出独立价(jià)值和独立视角的内容。AIGC的再次出(chū)圈，更代表着(zhe)未来的先进生产(chǎn)力即(jí)将到(dào)来(lái)。

紧抓大模(mó)型与算力，牢固AIGC底座

从技术的发(fā)展也可以看(kàn)出(chū)，在语(yǔ)言大模(mó)型、图(tú)像大模(mó)型之后(hòu)，多模(mó)态大模(mó)型已(yǐ)经成为了新的趋势(shì)。

大模型被誉为当(dāng)前(qián)人(rén)工智能(néng)发展(zhǎn)的(de)智能(néng)底座，是(shì)全球竞争最激烈的研究方(fāng)向之一，包括谷(gǔ)歌(gē)、亚马(mǎ)逊、百(bǎi)度(dù)、阿里、腾讯等(děng)众多头部企业都在(zài)竞相发力。

不过(guò)训练大模(mó)型的确(què)价格不菲(fēi)，以国盛证(zhèng)券发布的《ChatGPT需要多少算力》报告(gào)估(gū)算，GPT-3训练一次的成本(běn)约(yuē)为(wèi)140万美元。而对于(yú)一(yī)些(xiē)更大(dà)的LLM(大型语言(yán)模型)，训(xùn)练成本(běn)则(zé)介于(yú)200万美(měi)元(yuán)至1200万美元高(gāo)价之间。

以ChatGPT在2023年1月的独立访客平均数1300万计算，其对(duì)应芯片需求为(wèi)3万多片英伟(wěi)达(dá)A100 GPU，初(chū)始投入成本约为8亿美元，每(měi)日仅电(diàn)费就在5万(wàn)美元左(zuǒ)右。

此外不论是ChatGPT还是AIGC，都离不(bù)开(kāi)庞大算力支持。在关注各类大模型的发展(zhǎn)同(tóng)时，更应该关(guān)注(zhù)算力网络的建设。

算力(lì)网络正(zhèng)驱动AI产业发展进入史(shǐ)诗级(jí)加速进程，让AIGC及通(tōng)用AI这(zhè)一人工智能(néng)发展的终极(jí)目(mù)标离得(dé)更近。

因为(wèi)算力(lì)可(kě)以对突破性技(jì)术创新提供大力的支(zhī)持(chí)。这方面，多模态大模型是典型(xíng)。作为(wèi)面向未来强(qiáng)人工智能、通用人工智能的重要技术创新，多模态(tài)大模型已(yǐ)经在人工智(zhì)能领域提(tí)出了(le)很多年，业界(jiè)也有不少技(jì)术(shù)突破(pò)，但(dàn)是，多模态(tài)大模型进一步(bù)往下走(zǒu)，算力需(xū)求呈几(jǐ)何(hé)式上升，一般(bān)的(de)算力(lì)基础设施很快(kuài)将难(nán)以胜(shèng)任。

从图像、文字(zì)、语音单独一项的训(xùn)练，到双模态、三(sān)模(mó)态的(de)跃(yuè)迁，让人(rén)工智能(néng)可以灵活应对不(bù)同模态的转化(huà)、像(xiàng)人(rén)与世界交互(hù)一样(yàng)自(zì)然，这方面，由算(suàn)力网(wǎng)络来驱动将有明显优势。