表示第一的词语四字，古代表示第一的词语-绿茶通用站群

表示第一的词语四字，古代表示第一的词语 ChatGPT之后又一应用杀疯了，AIGC或进入可控期，将洗牌科技行业？

自聊(liáo)天机器人ChatGPT火爆以来，微(wēi)软公司创始人比尔(ěr)·盖茨已多次公(gōng)开谈论(lùn)人工智能话(huà)题(tí)。在(zài)最(zuì)近的一(yī)次采访(fǎng)中(zhōng)，他再(zài)次表示：“AI可能会让科(kē)技行(xíng)业迎(yíng)来(lái)一次剧烈的洗牌(pái)”。

这个结论(lùn)是他在当地时间2月(yuè)20日接(jiē)受《In Good Company》节目专访时提出的(de)。

他预(yù)期，AI的(de)发展可能会威(wēi)胁到谷歌的市占率，因为微软在(zài)AI方面的(de)行(xíng)动相当迅速(sù)。而最(zuì)终科技巨(jù)头将把AI整合成用(yòng)户的“全能助手”，包揽一切(qiè)应(yīng)用，与人们进(jìn)行沟通并提(tí)供建议，可以取(qǔ)代亚马逊、Siri或Outlook等应用。

大(dà)佬(lǎo)口中全能助手(shǒu)的到来(lái)可能尚需时日(rì)，但由(yóu)ControlNet引发的又一(yī)次(cì)AI绘画(huà)浪潮(cháo)，让A表示第一的词语四字，古代表示第一的词语IGC在ChatGPT的话题热(rè)点包围(wéi)中杀(shā)出重围。

ChatGPT之后又一应用杀疯了，AIGC或(huò)进(jìn)入可控期，将洗牌科技行业？_黑(hēi)料正(zhèng)能量

ControlNet颠(diān)覆AI绘画(huà)新玩法

AIGC向可控(kòng)靠近

以AI绘(huì)画为代表的AIGC上一次爆火(huǒ)的时候，还是2022年8月，在(zài)美国科罗拉多州举办的新兴(xīng)数字(zì)艺术家(jiā)竞赛中，一幅名为《太(tài)空歌剧院》的作品(pǐn)获奖。

随(suí)后各(gè)大厂商的AI绘画软件被广大(dà)网友熟知并体验，Stable Diffusion便是(shì)其中代(dài)表(biǎo)。

用户们可以在应用中输入(rù)一组关键词或者一(yī)张照(zhào)片(piàn)，就能获得(dé)一幅AI创作的画作。

作画的关键就是所(suǒ)输入的文本。同一组关键词(cí)也可以创作出很多张风(fēng)格不一样(yàng)的(de)画(huà)作，这让创作(zuò)的(de)过(guò)程就像开盲盒(hé)。

很多用户很(hěn)喜欢这种不确定的惊喜，他们会将(jiāng)生(shēng)成(chéng)的美(měi)图(tú)当做头像。而(ér)另一部分喜(xǐ)欢翻(fān)看AI绘(huì)画的“翻(fān)车(chē)”作(zuò)品。在社(shè)交媒体(tǐ)上，许多(duō)用户(hù)分(fēn)享AI“翻车现场”，例(lì)如，一位网友(yǒu)的(de)小(xiǎo)狗照片(piàn)被AI画成了“肌(jī)肉男”，还有网友的(de)个人照(zhào)片被AI识(shí)别成了建筑。

而如今随着ControlNet的出现(xiàn)与(yǔ)加持，以往(wǎng)AI绘画(huà)的填写关键词游戏(xì)可能要(yào)被颠(diān)覆了。

ControlNet是一(yī)位正在(zài)斯坦福读博的中国人(rén)张(zhāng)吕敏创作(zuò)的一种基于控制点的图像变形(xíng)算(suàn)法，主要用于数字(zì)图像处理、计算机视觉(jué)和(hé)计算机图形学等(děng)领(lǐng)域。

其(qí)SD插件(jiàn)一经(jīng)发布(bù)，在短短的两天(tiān)内便成(chéng)为了AI绘画领(lǐng)域最新的热点。

在此之前，大家用了(le)很多方法(fǎ)想(xiǎng)让AI生成的结果尽可(kě)能的符合要求，但是都不尽如(rú)人意(yì)，它(tā)的出现(xiàn)代表着AI生成(chéng)开始(shǐ)进入真正(zhèng)的(de)可控时期(qī)。

因为ControlNet可以(yǐ)直接提取画面的(de)构图，人物的姿势和画面的深度信(xìn)息等。有了它的(de)帮助，就不用频繁的用提(tí)示(shì)词来碰运气，抽盲盒式的创(chuàng)作(zuò)了。

通俗的(de)说ControlNet相当(dāng)于给AI绘(huì)画加了“魔法”，不少博主的作品已经获得了(le)大(dà)量的(de)浏览量(liàng)，“viggo”就是其(qí)中之(zhī)一，他用朋友的(de)照(zhào)片直接(jiē)带她们走进动漫世(shì)界。

viggo先(xiān)用StableDiffusion图(tú)片转文(wén)字。

再用Text2Prompt插(chā)件拓(tuò)展找到对应的(de)关键词；最后用ControlNet插件绑定骨骼(gé)开(kāi)始换(huàn)关键词(cí)试效(xiào)果。

通过图(tú)片就可(kě)以(yǐ)看出来，效果(guǒ)十分惊艳。

更厉害的是，除了真实(shí)的照片(piàn)，草图也可以加上“魔法(fǎ)”，知乎大牛“DevPoint”和(hé)“逗(dòu)砂(shā)”介绍到ControlNet还能实现线稿(gǎo)转全彩图(tú)。大神(shén)张吕(lǚ)敏其本尊也亲自回应。

不(bù)得(dé)不说当下(xià)AIGC已经变(biàn)得越来越强大，甚(shèn)至输出的作品都已经能以假乱(luàn)真了。

难辨虚实，AIGC技术力爆发(fā)

警惕(tì)安全问题

近日，“苏(sū)州金鸡(jī)湖有游艇(tǐng)party”的消息火遍网络(luò)，而(ér)经过(guò)警方(fāng)辟谣(yáo)这所谓的“party”可(kě)能是全国第(dì)一起(qǐ)AI绘图诈骗。

由于这个活动里面给出(chū)的美女照片都是AI制作的(de)真(zhēn)人照片绘图，因为太逼真(zhēn)，被大家当成真事传播(bō)了。

不(bù)过仔细观察(chá)可以发现，活动发起(qǐ)者(zhě)提供的照(zhào)片中有个很大的漏洞可以发(fā)现(xiàn)并非(fēi)真(zhēn)人(rén)，而是AI绘图，那便是图片中女性的手指部分有的存在异常。

ChatGPT之(zhī)后又一(yī)应用杀疯(fēng)了，AIGC或进入可控期，将洗牌科(kē)技(jì)行业？_黑料(liào)正能量

有行业人事表示：“现在因为(wèi)手指部分(fēn)的(de)绘画算(suàn)法比较复(fù)杂，AI还不(bù)太会(huì)画人的手，但最新看到的图片已经有(yǒu)越(yuè)来越完美的AI模型出现，以(yǐ)后可能就完(wán)全没有漏洞了(le)。”

类似的(de)AI作图诈骗(piàn)在国外也已有发生。据英(yīng)国广播(bō)公司报道，土耳其(qí)地震(zhèn)期间，有Tiktok用(yòng)户使用AI合(hé)成了(le)儿(ér)童受灾的假照片发布到网络，以此诱骗善良的(de)人(rén)打赏“捐助”从而实施诈骗(piàn)。

目前随(suí)着技(jì)术(shù)发(fā)展，AIGC已(yǐ)经能做出真人(rén)照(zhào)片般的绘(huì)图效果，如果这(zhè)样的(de)图片被用来诈骗，将(jiāng)非常可怕。

此外AIGC还引发了很多(duō)担(dān)忧(yōu)，一方面，批判(pàn)者(zhě)认(rèn)为AI在(zài)“学(xué)习”了大量前人的(de)作品之后，其(qí)创作没(méi)有任何情绪和灵魂，难以和人(rén)类(lèi)的艺术创(chuàng)作相提并论(lùn)。

另一(yī)方面，AIGC背(bèi)后的版权、目前都并没有(yǒu)得到有效的解决，还有AIGC会(huì)不会代替人类“至高(gāo)无上”的创(chuàng)意。

马(mǎ)斯克也强调，人工(gōng)智能的安全问题需要得到重视(shì)，太(tài)晚就来不及了。

AIGC下一站除了视频，还有(yǒu)远方

技术都是有(yǒu)两面性的，潜在(zài)的危害并不能(néng)掩盖其光辉的贡献。现在看来，人工智能技术(shù)将是(shì)第四次工业革命的核心驱动力量，将创造新的增长奇迹。

过去(qù)一年，人工智(zhì)能在(zài)技术(shù)和商业层面都(dōu)有了巨大进展(zhǎn)，AI绘画就是人工(gōng)智能(néng)技术发(fā)生(shēng)方向性改变的一个代表。其下一站或许就(jiù)是视频(pín)。

此前，Meta和谷歌先后发(fā)布了(le)几条(tiáo)引爆科技圈的短视频。这些视(shì)频引发关注并非内(nèi)容做得多优秀，反而都(dōu)非常简单，比如一匹正在喝(hē)水的马，一只画画的玩具熊(xióng)，或(huò)者一段骑(qí)摩(mó)托车的第一视角录像(xiàng)，随便(biàn)一个有手机的人都可(kě)以随手录下(xià)一段。

但(dàn)这些短视频的创作(zuò)方(fāng)式非(fēi)常(cháng)简单，创作者仅仅需(xū)要向AI输入一段(duàn)话，甚至(zhì)只是(shì)说一下要(yào)求，AI就(jiù)可以根据需要生(shēng)成一段视频。

谷歌发布(bù)的两(liǎng)个AI生成视(shì)频分别(bié)来(lái)自于Imagen Video和Phenaki，前者(zhě)主要(yào)突出(chū)的是高清，与Meta的Make-A-Video没有太多(duō)的差别。

在Make-A-Video公(gōng)布了AI生成的视频后，AI圈就已经玩了一波梗，一个能够做出(chū)更高(gāo)清视频(pín)的AI还(hái)不足以在短时间内戳中兴(xīng)奋点。

Phenaki更加令人震惊的地方在(zài)于(yú)，它(tā)可(kě)以制作(zuò)出超过2分钟的连贯的(de)也有确切内容的视(shì)频，这(zhè)才是(shì)真正(zhèng)让人们(men)感到惊(jīng)喜的地方。因为无论AI生成(chéng)的视频多么(me)高清，也只能是为内容生产者提供一个灵感(gǎn)，一个素材(cái)，一个过(guò)场动(dòng)画。

不过能够(gòu)制作出有具体剧情内容的视频就意味(wèi)着，一些视(shì)频创作由(yóu)AI代替人工完成已经初步有了可能。

当下AI的(de)发展速度(dù)已经(jīng)超过大部(bù)分人的想象。内容产业(yè)的本质是供给(gěi)创造需求，AIGC作为全(quán)新的(de)内(nèi)容(róng)生产方式(shì)，可以为内(nèi)容产业带来更新的内容风(fēng)格、更快(kuài)的(de)生产(chǎn)速(sù)度(dù)，更(gèng)低(dī)的生产成本(běn)，这无疑(yí)会驱动内容产业的大爆发(fā)。

除了AI绘图、视(shì)频，AIGC技术(shù)还能应用于音乐、代码、机器(qì)人动作(zuò)等(děng)多(duō)种内容形(xíng)式的生成。不难(nán)发现该项技(jì)术(shù)不仅在游戏等行业能得到有效应(yīng)用，对于下一代互(hù)联网(wǎng)各(gè)种元素的构建(jiàn)亦(yì)有关(guān)键意(yì)义。

从商业化(huà)的角度来看(kàn)，文化娱乐、教育、传媒等诸多领域，本身就(jiù)对(duì)基于AI的可视(shì)化内容有强(qiáng)烈需求(qiú)。

因(yīn)此，AI绘(huì)画及视(shì)频或不是结果，而(ér)只是AI进程中的一块重(zhòng)要拼图，有望(wàng)在(zài)技术更新的加持下实现更大的应用价值。

AI从(cóng)理解内(nèi)容，走向了可以生成(chéng)内(nèi)容(róng)，甚至能够创(chuàng)造出独立价值和独立视角的内容。AIGC的(de)再次(cì)出(chū)圈，更代表着未(wèi)来的(de)先进生产力即将(jiāng)到来。

紧抓(zhuā)大模型与(yǔ)算力(lì)，牢(láo)固AIGC底(dǐ)座

从技术的(de)发(fā)展(zhǎn)也(yě)可以看出，在(zài)语言大模型、图像大模型之后，多模(mó)态大模(mó)型已经成为了新的(de)趋势。

大模型被誉为(wèi)当(dāng)前(qián)人工智能发展的智能底(dǐ)座，是全球竞争最激烈的(de)研究方(fāng)向(xiàng)之(zhī)一，包括(kuò)谷歌、亚马逊、百度、阿里、腾讯等众多头(tóu)部企业都在竞相发力。

不过(guò)训练大模型(xíng)的确价格(gé)不菲，以国盛证券发布的(de)《ChatGPT需(xū)要(yào)多少算力》报告估算，GPT-3训练一次的成本约为140万美元。而对(duì)于一些更大的LLM(大型语言模(mó)型)，训练成本则介(jiè)于200万美元至1200万美元(yuán)高价之间。

以ChatGPT在(zài)2023年1月的独立访客(kè)平均数1300万(wàn)计算，其对应(yīng)芯片需求为(wèi)3万多片英伟达A100 GPU，初始投入(rù)成本约为8亿(yì)美(měi)元，每日(rì)仅电费(fèi)就在5万(wàn)美元左右(yòu)。

此外不论是ChatGPT还是AIGC，都(dōu)离不开庞大算(suàn)力支持。在关注各类大模型的发(fā)展同(tóng)时，更(gèng)应(yīng)该关注算力(lì)网络的建设。

算力(lì)网络(luò)正驱动AI产业发展(zhǎn)进入史诗(shī)级(jí)加速进程(chéng)，让(ràng)AIGC及通用(yòng)AI这一(yī)人(rén)工智能发展的终极目标离得更近(jìn)。

因为算(suàn)力可以对(duì)突破性(xìng)技(jì)术创新提供大力(lì)的支(zhī)持。这方面，多模态大模型是(shì)典型。作为(wèi)面(miàn)向未(wèi)来强人工智能(néng)、通用人工智(zhì)能的重要技术创(chuàng)新(xīn)，多模(mó)态(tài)大模型已经在人工智能领域提(tí)出(chū)了很(hěn)多年，业界也有不少(shǎo)技术突(tū)破，但是，多模态大(dà)模型(xíng)进一(yī)步往下走，算(suàn)力需求呈几(jǐ)何式上升，一般的算力基础设施很快将(jiāng)难以胜任。

从(cóng)图像、文字(zì)、语音单独一项的(de)训练，到(dào)双模态、三模态(tài)的跃迁，让人工智(zhì)能可以灵活应对不同模(mó)态的转(zhuǎn)化、像(xiàng)人与世界交互一样自然，这方面，由算力(lì)网络来驱动将(jiāng)有明(míng)显优势。