“读文画图”,微软 AI 的想象力可能比你的还好!
长按识别二维码,报名2018十大突破技术全球直播首发
此前,谷歌曾经教过人工智能如何涂鸦,不过这只是一些简单的线条,而更复杂的一些图案对于计算机来讲可能就会稍显困难。而现在,微软的研究人员已经利用人工智能技术实现了这一突破,他们可以做到将文字性的描述转成活灵活现的图像。
试想一下,你给出了一段描述,“画一只短嘴巴的黄色小鸟,而且它的翅膀必须是黑色的”然后计算机就按照你说的把这只鸟画出来了,怎么样,是不是很酷?
同时,微软首席研究员还特地强调,系统不是根据您的描述去图片库里寻找一张对应的图片,它完全是自己创作出一张图像,“计算机画出来的这只鸟可能并不存在于真实世界中,它只不过是计算机想象力的发挥而已!”
当然,任何新推出的技术都肯定或多或少面临着些许瑕疵,但不难想象,未来这项技术可以成为画家或室内设计师的得力助手,更远一点,甚至人们完全可以根据一个剧本就用计算机生成一部动画电影,想到这里,是不是所有的演员都会感到心头一颤!
微软的这个团队一开始是借助一个名为 CaptionBot 的 AI 系统来深入研究计算机视觉和自然语言处理的问题,该系统可以自动为照片添加字幕,之后,他们又创建了一个名为 SeeingAI 的 AI 系统,它的作用是为类似盲人的群体提供语音问答服务。
目前,这种计算机绘图的技术主要有两部分技术构成:生成对抗网络(GAN)和判断所生成图像质量的鉴别器(discriminator)。绘图计算机在被“灌输”了无数的图像和字母描述之后,它逐渐学会了哪种文字该匹配哪种图像。
最后,该团队还创建了一个用数学方法描述“人类注意力”的机制,这被用来从复杂的描述中获取有用的数据信息,就例如“红色的翅膀、尖锐的喙、黄色的翅膀”等等概念,这些概念对于机器来讲不是很好理解,所以需要转化成数学的方法来进行分析。
-End-
参考:
https://www.engadget.com/2018/01/18/microsoft-ai-draws-images-from-detailed-text/
本书灵感源于“TR35”,即《麻省理工科技评论》享誉全球的“35 位 35 岁以下科技创新青年”(MIT Technology Review 35)青年人才榜,如果你想一睹全球科技创新领导者背后的精彩事迹,你也一定不能错过这本书。
各大电商促销火热进行中,点击阅读原文预购直达
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
随时掌握互联网精彩
- 1 老百姓的事情是最重要的事情 7919928
- 2 多省否认花一万亿推平黄土高原 7931715
- 3 央视蛇年春晚分会场确定 7893527
- 4 数说2024中国经济脉动 7777541
- 5 13.2万瓶“特供酒”销毁 7671284
- 6 中国籍两兄弟在日本偷走3200颗包菜 7566383
- 7 近9000亿美元!拜登签了 7471598
- 8 网红羊毛月被禁止关注 7305920
- 9 充绒量仅3克 波司登客服回应 7260221
- 10 景区回应李现在虎跳峡举国旗 7198346