大厂们的AI绘画,还差点意思

问问大伙,你觉得今年最火的新技术,或者基于老技术下的新应用是什么?


有人可能会说,是处于诈骗和艺术叠加态的NFT。


这两年NFT算是经历了大起大落,刚吹起这阵风时,小到散户,大到科技巨头都在捧这玩意儿。


什么不可篡改啊、能有效保护版权等特性,被行业吹得天花乱坠。


也因为NFT有着所谓的“唯一性”,即使是一张简单的图片,也能做成NFT上链,被炒到天价拍卖。


图源:小雷哔哔


像是上面这张图,就是玩偶姐姐推出的“初号机”NFT系列里的作品。


当时卖得老贵了,最便宜的一张,报价也来到0.16 ETH。


按照当时以太坊的市值,大概要4000多块钱才能买下,名人效应直接拉满。


不过,随着各种NFT游戏和关联虚拟币的暴雷,网友们也终于意识到“这玩意水太深,我把握不住”。


盤點四大轉瞬暴跌熱炒NFT 最多高位插99%

图源:fintalk180


你想想,连周杰伦和陈冠希等明星的NFT都直线暴跌。


更别说市面上那些来路不明的妖魔鬼怪了...


而真要说有啥技术是迭代很快,且应用场景广泛的,小雷觉得就是今年走红的AI绘画了。


AI绘画,从高门槛到人人可玩


严格来说,AI绘画不算是“新”技术。


和AI换脸、AI去马赛克等技术一样,AI绘画也经过了很漫长的发展阶段。


早期的AI绘画虽然能用,但风格极其抽象,艺术造诣过高,足以劝退普罗大众。


图源:维基百科


也就是这两年来,投喂的素材量多起来了,加上算法上的优化,AI绘画才变得越来越懂人类。


名人、网红、游戏、艺术、科技...我们能想到的所有领域,这些AI皆有深度学习过。


所以在输入各种奇怪的关键词时,AI才能给我们生成近似的场景,关键是违和感还很低。


“蹲在街边抽烟的帅哥”

image.png


小雷之前就用Stable Diffusion尝试过,我输入“手机”关键词后,AI花了不到一分钟,就把图给我画好了...


不仅整得有模有样啊,AI还完美规避了版权,没有出现任何厂商的Logo。


图源:Stable Diffusion


除Stable Diffusion,今年火出圈的AI绘画项目,还有DALL·E2和Midjourney。


之前就有一位美国老哥,参加绘画比赛时,用的就是Midjourney来生成画作。


最后还真给他拿了个第一名...


图源:微博


怎么说呢,虽然AI绘画争议很多,版权、法律甚至是伦理问题都还没捋清楚。


但不得不承认,开源且免费使用的Stable Diffusion,确实让AI绘画的门槛变得更低了。


以前AI绘画可能是技术大佬们的专属技能。


现在倒好,Stable AI公司直接把Stable Diffusion端上来,并告诉咱们:


“这套模型我们已经训练得差不多了,大伙只要往框里输入关键词,就能生成对应的画作。”


image.png

图源:Stable Diffusion


这种懒人级别的AI操作,就算是路人,也忍不住想把玩一番...


而用户的需求激增,自然就带动了大公司和资本们的关注。


现在已经有很多小公司把开源的Stable Diffusion拿来用,在往里头加点自研算法,就能创业发家了。


像是创业公司writesonic,就套了Stable Diffusion的壳,做出了自家AI绘画生成器。


image.png

图源:writesonic.com


小雷也打个不一定恰当的比喻,Stable Diffusion就像是高度集成的“预制菜”。


里面的料充实管饱,还充分考虑到营养搭配,荤素全都有。


哪怕你平时不会做菜,只要把这预制菜放进锅里炒熟,还是能摆上饭桌吃。


ceeb653ely1g0q4urqwzsg207u07u7s6.gif


经验丰富的老厨师遇上这抢手预制菜,更是如虎添翼,把预制菜做成山珍海味都不是梦。


So,如果是自带流量的大公司们,玩起AI绘画,那就真是秦始皇摸电线 - 赢麻了





当国内大厂都玩起AI绘画


说出来你们可能不信,咱们熟悉的百度、抖音和腾讯,最近都推出了自家的AI绘画工具。


或许它们的工具属性和受众倾向不同,但目的都是相似的。


一方面是想趁着Stable Diffusion带起的“AI绘画潮”,推出同类吸收流量。


小雷此前的《神图》栏目就发过一期AI画画,能看出大伙儿对AI绘画是真的感兴趣。


image.png

图源:小雷哔哔公众号


另一方面呢,在整个AI绘画工具运营的时候,也顺便做点测试,看看是否有商业化能力(能不能赚钱)。


不过咱们作为用户,不用考虑那么多,还是先把各家大厂的AI画画工具用一遍再说。


首先是抖音近期推出的“AI绘画”功能。


image.png


小雷事先说明一下,抖音的“AI绘画”更偏重娱乐性,所以很多时候会出现“翻车”现象。


但这大概也是抖音想要的效果,只要能让用户觉得好玩,绘画准确与否都不重要。


比如,有网友用叱咤欧洲的历史人物拿破仑来整活。


经过AI的二次创作后,霸气十足的拿破仑秒变温婉貌美的二次元妹子。


好家伙,硬搞节目效果是吧。


44.jpg

图源: 抖音@渤汐


同样的剧情总会再次出现,这位特意丑化自己的老哥,被AI画成了一脸妩媚的样子。


44.jpg

图源:抖音@阿廖沙别害怕

 

腾讯这边则是推出了#QQ小世界AI画匠#活动,并上线和抖音AI绘画类似的工具。


总的来说,腾讯和抖音的AI绘画玩法别无二致,都是基于原有素材进行二次创作。


而且啊,这些A绘画所输出的作品,画风都更偏向二次元。


小雷也搞不动具体原因,大概是考虑到动画人物,更容易规避版权风险吧。


image.png

图源:QQ


相比之下,百度推出的的AI绘画工具“文心一格”,玩法就和开源的Stable Diffusion比较像了。


连流程都是差不多:


输入关键词 → 选择自己想要的风格 → 付费 → 等待2分钟生成画作。


image.png

图源:百度


不过,百度这个并不是完全免费的,画风也不如Stable Diffusion那么写实,走的还是艺术流路线。


至于收费方面,所有初始用户会获得200电量,每次生成画作会消耗2 - 3电量。


用完了以后,大伙就得掏钱充值啦。


只能说啊,这波操作非常符合国内大厂的运营策略,不赚钱的产品,就没有存在的必要。


explorer_a2v9xGnJq7.jpg

图源:问心一格


对了,微信上也有一个叫做“意间”的AI绘画小程序。


随着AI绘画越来越火,“意间”小程序用户量也越来越多了。


它的具体玩法和Stable Diffusion同样差不多,输出关键词,再选择风格生成即可。


image.png


大伙可能有疑问,为啥和Stable Diffusion那么像呢?


很简单,因为这个小程序,调用的就是Disco/Stable Diffusion模型。


基于免费开源且成熟的绘画模型,在往里面加点料,一个拥有商业化能力的绘画小程序就做出来了。


赚钱嘛,不寒碜。


image.png

图源:微信意间小程序


聊到这里,咱们可以简单做个总结。


Disco/Stable Diffusion这两个开源模型,风格上比较写实,说白了就是更接近人眼所见。


image.png


硬要说区别,大概就是Disco比较大胆,画作想象力丰富,但也容易翻车。


而Stable突出一个稳定,整体画风更加写实保守,更适合普通人使用。


比如这张布达拉宫图,Disco和Stable就画出了两种风格。


image.png

图源:网络


但当AI绘画潮卷到了国内,大伙会发现,国内大厂们反而没有跟着“祖师爷”的路子走。


有的是基于原素材搞二次创作,有的能根据关键词生成画作,但风格过于特别,并非常人能接受。


而且啊,有些AI绘画工具,明明只是Stable Diffusion打包制作而成,却搞了付费使用机制。


虽然开源协议上,并没有规定不能商用,但如果不能做得免费的原版好用,似乎也没有付费使用的理由了。


image.png

关键词:蝙蝠侠 VS 蜘蛛侠


至少小雷在使用Stable Diffusion的时候,真的能感受到,这个AI模型是懂我想画什么的。


长远来看,AI绘画无疑有着很高的上限,商业化能力不可估量。


但就目前的情况嘛,大厂似乎都是想着,先做个东西占坑,并没有想着真正把这事儿做好。


这可能和AI带来的诸多争议有关,版权归属、恶意创作黄色画作等都是大问题。


简单的娱乐化,还是目前大厂绘画工具的主要方向。