2016 年,由人工智能撰写《电脑写小说的那一天》小说成功通过了日本「星新一文学奖」的初选;Sony 开发的 DeepBach AI 在深度学习巴赫后,创作出的仿巴赫音乐,在 1600 位听众里,骗过了超过一半的人,让他们以为这就是巴赫本人的创作。
如今,人工智能已经能生成真假难辨的视频,极具艺术感的图像。
人工智能正在挑战着文学、音乐、绘画、影视等等这些原本属于艺术创作的领域。
当艺术难以成为人类对抗 AI 的护城河后,许多人认为,诗歌或许是智能时代,人类最后被攻克的堡垒。
诗歌被认为是人类文学最初的起源,在尚未有文字的人类社会,诗歌就以口语的形式流传在文明里。
它在形式上考验节奏和韵律,在表达上考验想象和凝练,它需要表达者把经验、观察、意识结合,毕竟诗歌的创作依托于于人类特有的通感,因此我们可以让 ChatGPT 写一首关于月亮的诗,它只会泛泛而谈,而无法和人类在当时当刻,设身处地看到独一无二的月亮。
但是,如果 ChatGPT 有了能「看到」月亮的能力,给它思考赋予观察呢?基于这个想法,Kelin Carolyn Zhang 和 Ryan Mather 两位设计师和开发者鼓捣出了一台设备:让摄影机去「所见」,让人工智能去「所感」,用技术的手段去实现文学里最难以量化的表达。
这就是诗歌相机(Poetry Camera)。
相机与诗诗歌相机内核搭载了树莓派,一个只有信用卡大小的微型电脑,得以成像和调取 GPT-4 的 API,这就打通了设备的「眼睛」和「大脑」。
举起诗歌相机,随便拍下一张照片,计算机视觉算法会开始分析视觉数据,人工智能模型开始解释图像,识别图像里关键元素、颜色、环境、影调情绪等信息,生成诗,并且以类似超市收银条的方式打印出来,就好像拍立得「洗」出照片一样。
拍照出诗不出片,这可比拍立得更让人有期待和惊奇感。
不看宣传看效果,它能生成怎样的诗歌呢?图源:TechCrunch有用户拍下了早上自己在家里喝咖啡时玩手机的样子,诗歌相机的创作是:镜头后面,一人调整视线,在正方范围里的像素空间。
……日光透过褪色的薄纱,他手上,温热的咖啡流转。
对话传出,跨过虚拟的边界,他的倒影镜像,在屏幕上出现。
书架上,书本倾斜,无声的喋喋不休,茂盛的植物,是唯一的生命。
戴着眼镜,家成了他平静的面糊,在这堵墙里,他的世界四散开来。
在 2024 年 4 月的一个清晨,一种新的常态,悄悄地磨损。
@poetry.camera不难看出,哪怕经过简单翻译,它生成的文字依然有诗歌特有的「意象感」。
诗歌相机的原文更显用词文法上「刻意地精妙」,比如每一段都在押韵脚,比如第一段的 lens,gaze,space,place,race,第二段的 sheers,steers,frontier,appears。
在用词上也会采用诗歌用词,比如把 morning 写成 morn,就像中文里把「早上」写成「晨」一样。
图片