收起左侧
发新帖

AI只会画画聊天?这家公司可能要打破一切了

时间:2022-12-19 15:13 0 492 | 复制链接 |

马上注册,结交更多好友

您需要 登录 才可以下载或查看,没有账号?立即注册

x
DSC0000.gif

如果说这半年来,当红炸子鸡是哪一位。
那 AI 生成内容说第二,恐怕也没有人敢说一。
虽说热度一直没停过,但是这几天感觉,看 AI 们乱杀,完全不如看它翻车来得有意思。比如下面这种认人成狗的乌龙。
DSC0001.jpg

又或者是这种莫名其妙直接让人头脚倒置的。。。
DSC0002.jpg

甚至互联网上还出现了一大批带着 AI 生成的图,想替兄弟讨回公道的网友们。
DSC0003.jpg

连无穷小亮都中招了,在自己的微博声讨 AI 。
DSC0004.jpg

不过,AI 犯傻也不是一天两天了,自 从 DALL·E 带头的这批绘画模型出现后,各种段子就没停过。
比如因为喂的素材不够多,一旦涉及了知识盲区,AI 就开始不懂装懂,原地乱画。画出来的筷子,世超怎么看都觉得手里那个,更像我奶奶的锅刷。。。
DSC0005.jpg

输入的描述词如果有点抽象的话,AI 甚至会画出一些有点冒犯性的照片。
比如非常经典的 “ 鲑鱼回流 ” 图,是鲑鱼看了要喊律师的水平。
DSC0006.jpg

结果,这AI 绘画的热度还没降下来,AI 聊天就又来了。
世超左手边的同事在玩 Stable Diffusion ,右手边的人就在和 chatGPT 聊天。这款AI 聊天应用上线的时候,火到连马斯克都在调侃,人们陷入了一个 GPT 的循环里面。
DSC0007.jpg

世超自己还没体验上呢,各种网友调戏AI 聊天的段子又横空出世了。
比如给AI 出脑筋急转弯,结果当然是一头撞到了墙上。
DSC0008.jpg

又或者是用中国人的经典小学数学题,考验对方。虽然 AI 答题态度很好,试卷题目都写满了,但是没一个答案是对的。。。
DSC0009.jpg

不过啊,玩归玩,闹归闹,但 AI 要是认真起来,实力早已经相当可怕了。
虽然 chatGPT 做不来脑经急转弯,但是它可以快速找出一段代码中的 bug ,并且完成代码修复。
DSC00010.jpg

而偶尔犯傻的 AI 绘画,如果调试得好,它甚至能帮你做出一张足以拿奖的作品。
DSC00011.jpg

国外甚至已经有人用chatGPT 和其他AI 绘画软件,创作了一本儿童读物《 Alice and Sparkle 》。目前,已经上架了亚马逊。。。
DSC00012.jpg

玩梗归玩梗,但 AI 的潜力网友们早就心知肚明。像老美做的 chatGPT 这类AI 应用,国内其实也早就有企业悄咪咪在跟进做了,比如抖音、意间之类的。
而这条赛道上,甚至还有一个你完全想不到的参赛选手,就是靠游戏起家的互联网出海巨头——昆仑万维
DSC00013.jpg

说实话,虽然它是以游戏起家的公司,但是世超第一时间想到的已经不是游戏业务,而是它在全球范围的各种业务和投资。
比如想要做浏览器,但是大部分浏览器市场都被谷歌牢牢地坐在屁股下面。
于是,昆仑想到了收购没落的 Opera 浏览器,带着它从非洲这个互联网增速最快的新市场入手,把这个没落的浏览器,扶上了非洲第二大浏览器的位置。
DSC00014.jpg

再比如虽然也搞社交聊天,但是却投资了同性交友软件 Grindr 。因为群体的高消费属性,直接给企业带来 29.5亿的收益。。。
而这一次,昆仑万维早在 2020 年就瞄准了 AI 这个炙手可热的香饽饽。
虽然老本行靠游戏发家,但是昆仑做起 AI 项目来,也毫不马虎。前面咱们聊过的绘画和聊天模型,昆仑万维全都有布局。
废话不多说了,练家子还得拿出真本事来,咱们直接上手体验一下。
先是昆仑万维用现在最火的AI 绘画模型 Stable Diffusion ,做的一个支持中英文双语的AI 绘画模型——天工巧绘 SkyPaint 。
天工巧绘这个模型目前可以在小程序上体验它的实力,小程序界面非常简单,输入描述词后,就可以一键生成画作。而输入之后,程序都会一次性生成四张图片。
世超体验了一下,基本上所有图片都能在 10 秒之内生成。
DSC00015.jpg

世超先用兄弟小黑胖试了一下,输入了:“ 一个丰富细节的小黑胖。”
结果,小黑胖这么挫的名字,居然获得了一张这么细致的生成图。。。甚至连裤子和手部的纹理细节,都渲染出来了。
说实话,才 10 秒不到就能做出这么细致的图片,确实是超乎了世超的预期。
DSC00016.jpg

但是,光用这些普通的描述词有啥意思,不如给 AI 搞点抽象的东西,考验一下。
于是,世超尝试了一句陆游《 十一月四日风雨大作 》里的名句—— “ 铁马冰河入梦来 ”
结果,天工巧绘真的画出了一只踏着云霞,毛发飘逸的铁青色马匹。
DSC00017.jpg

不服输的世超又用更抽象的 “ 灯火阑珊处 ” 试验了一下,结果也是非常惊喜。
甚至,世超从这一句中文古诗词的生成结果里,感觉到了一些赛博朋克的味道。
DSC00018.jpg


DSC00019.jpg


DSC00020.jpg


DSC00021.jpg

可能有小伙伴发现了,世超从头到尾用的都是中文。甚至,后来使用的古诗词,天工巧绘都能很精准地读懂我的意思。
其实说到 AI 绘画,世超想要说一个容易被人遗忘的关键词输入
所有人都盯着最后生成的图片看,但是,却忘记了 AI 绘画的第一步其实是文本输入。
比如你想获得这样一张充满现代感,并且风格强烈的图片。
DSC00022.jpg

那你可能得输入长达七行的关键词,才能获得一张满意的作品。。
DSC00023.jpg

因此关键词还被做成了一门暴利的生意,一家叫 PromptBase 的公司,主就是专门售卖 “ 关键词 ” 。一个关键词,能卖到 1.99 美元的价格。。。
DSC00024.jpg

说实话,匮乏的英文储备,每次都限制了世超的发挥,用的时候,还得在旁边挂一个谷歌翻译。
这不,为了方便中文用户使用,昆仑万维直接做了一套中文文本模型
虽然咱看着好像没啥难度,不就是英译中吗。但是,这项目一开启,就是一个止不住的投资无底洞了。
DSC00025.jpg

首先中文是一种信息密度更高的多维语言,简单来说,就是表达的意思会比英文更复杂。
这个前提下,要想做中文模型,就得花大量精力做语料清洗和中文语义的理解。为了提高 AI 的准确性,昆仑用了一种 “ 回报机制 ” 来训练这个模型,简单说就是给模型做的试卷打分。
DSC00026.jpg

给模型出一百道题,最后工程师们给 AI 提交的答案挨个评分。通过这种方式,给 AI 做一对一语文辅导,慢慢提成绩。
这看似容易的英译中服务,其实非常烧钱。
昆仑万维为了做这块,光是加速卡就有两百多张,仅仅是硬件支出就得近千万,而这还不算人力成本投入。模型每个月的训练成本,又固定是上百万。。。
DSC00027.jpg

烧了这么多钱后,他们才慢慢把这套大语言模型打磨出来,用最少的人力,获得了很好的效果。
也是依靠着它,天工巧绘才能够很好地理解世超输入的中文语义。
而依托这套中文模型,昆仑万维也用 GPT3 做了一套 AI 文本模型——瑶光
除了基本的聊天回答、摘要、续写之类的功能,还有很多针对中国人的各种传统技能,比如对对联,古诗词之类的。
DSC00028.jpg

而 chatGPT 能够做到的代码修复,昆仑万维也没落下。他们直接做了一套 AI 编程助手SKYCODE ,只要给它输入一段代码,它就能帮程序员们完成后面的续写。
当然这套 AI 代码模型,也是完全支持中文注释的。
而在 AI 编曲赛道上,昆仑也是赛道的头部,依托自己的音乐社区 Starmaker ,昆仑搞到了目前市面上最全的音乐数据集。
旗下的 AI 音乐工作室StarX MusicX Lab 制作的曲子现在已经是非常成熟,大家在 Spotify 、QQ 音乐、网易云音乐上就能直接搜到。
DSC00029.jpg

看到这,可能很多人会觉得疑惑了,为啥昆仑万维作为一家互联网平台出海企业,却看似 “ 不务正业 ” 地花这么多力气,来搞这个全新的业务呢?
其实,上面咱们聊的那么多东西,有个总称,也就是 AIGC 。说白了,就是让 AI 来提供和创造内容。
所以 AI 的用途,可远不止开头那些玩梗这么简单的。
DSC00030.jpg

虽然一开始,大家对AI 还都嗤之以鼻,早几年听过最多的词就是:人工智障。
包括 2019 年李开复在《 人工智能 》里说的,也只觉得 AI 最多,就只能够代替人们五秒钟的工作。比如人脸识别、淘宝客服回复的水平。
DSC00031.jpg

但是,慢慢地所有人都发现事情不简单了。
尤其是身处 2022 年年末的我们,被 AI 轰炸了一整年,眼看着 AI 绘画从 DALL E 到 Stable Diffusion ,AI 聊天从续写到及时应答。
当年的 DALL·E ▼
DSC00032.jpg

照这个势头下去,AI 似乎真的要奔着超越人类去了?
DSC00033.jpg

虽然还不至于到取代人类的地步,但是 AIGC 对我们生活的改变,很有可能有18 世纪时,人们跨入蒸汽时代那么大。
只不过,这一次负责驱动的,是一个看不见、摸不着的计算程序。
AI 给人们带来的不是失业,而是人与机器共存、协作完成各类工作的全新时代。
DSC00034.jpg

而昆仑万维的所有布局,就是为了迎接这个时代。
就在昨天,昆仑万维召开了一场线上发布会,宣布把覆盖绘画、文本、编程三大块的 AIGC 模型,正式地开源发布。
DSC00035.jpg

这就意味着利用昆仑万维的算法与模型,作为应用开发的底层基石,所有人都可以自由地搭建自己需要的垂类应用。
DSC00036.jpg

昆仑万维会选择把耗费数千万的模型,对外开放的原因,一方面当然是希望通过更多人的参与,让昆仑天工有更多的应用可能性和创新性。
像完全开源的 Stable Diffusion ,网上就有各种各样地围绕它的创意版本。
网友魔改的宝可梦版 ▼
DSC00037.jpg

而另一方面,一项技术进步,只有给普通人带来便携,才具有正面的社会意义。
DSC00038.jpg

尤其是当技术都掌握在头部手里,算法的成本只会水涨船高。技术壁垒的高墙,就这样慢慢地越砌越高。
最后,个人开发者或者是小企业,就被会高成本拦在门外。
但是,昆仑万维觉得技术不应该只属于头部。所以,他们打从一开始,就是冲着对外开源这个方向去的。
通过模型开源,降低行业门槛和开发成本。而且,开发中文大语言模型作为支撑,更好地配合中文使用者的习惯。让更多的个人开发者或者是中小厂,也可以搭上AIGC 这辆高效的马车。
已经落地了的昆仑 AI 音乐就是很好的例子。
昆仑万维有一个叫 starmaker 的音乐 K 歌软件。可能你会有点陌生,因为它主要是面向的是海外用户,在南亚东南亚、中东南美洲地区的活跃用户已超过 5000 万。
DSC00039.jpg

昆仑根据 starmaker 开发了各种音乐类的游戏。对于音乐类游戏或者应用来说,歌曲库的丰富程度,肯定是执掌大局的关键。
但是,一首曲子的制作成本费用,最便宜也大概在三万多左右。。
DSC00040.jpg

有了自己的AI 音乐实验室 MusicX Lab 之后,他们利用 AI 就能快速玩出各种想要的音乐风格。最近,昆仑做了款音乐游戏,里面有接近两百多首的音乐,全都是来自这个工作室。
假设用 AI 制作只是省去一半成本,那也是减少了将近 300 万的支出。。。
这还仅仅只是 AI 音乐的可能性,之后 AIGC 还会深入到各种创作者的工作之中去。例如 AI 绘画以可以后帮助原画师、3D 美术师、艺术家等等进行内容创作,帮助画师们打开想象。
就算是普通的用户,也有使用它的可能。比如搭建一个专门做各种美甲图片的应用,美甲师们只需要动动手指,就能获得各种甲面风格。
甚至有一天,你可能会发现在文章的最后,署名不再是世超,而变成了 chaping AI 。
DSC00041.jpg


DSC00042.jpg
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

扫码添加微信客服
快速回复 返回列表 返回顶部