摘自《未来呼啸而来》-飞速发展的9大指数型技术融合
重塑娱乐业
要讲述数字娱乐崛起的故事,一个很好的方法是从奈飞创始人兼首席执行官里德·哈斯廷斯(Reed Hastings)做出的四个关键决定讲起。哈斯廷斯做出第一个决定时是1999年。当时他是以从计算机科学家转变成为企业家的跨界人士身份出现在世人面前的。在那之前,他创办的第一家软件公司已经公开上市了,他选择将股份套现,为自己留下一笔可观的资金,用于投资创办下一个企业。哈斯廷斯当时想到了一个有趣的主意,他想通过互联网来出租DVD,然后利用邮政服务把它们寄出去。很快他就将这个主意付诸实践,正是这个决定造就了后来的奈飞。
几个月之后,哈斯廷斯做出了第二个决定,他想到了一个更好的主意,即永远不向消费者收取滞纳金。第三个决定则是使奈飞实现真正的突破的关键,他们开发了杀手级应用程序“排队”(queue)。订阅用户可以创建一个他们想看的电影列表,一旦将之前租赁的DVD寄回,奈飞就会寄出另一张。奈飞的DVD租赁政策允许一次预定三部电影,因此用户永远不会没有电影可看。这项为用户带来极大便利的政策,使奈飞变成了众所周知的租赁电影DVD的好地方。渐渐地,实体租赁店的客户越来越少,(更何况如果租赁过期了,他们还必须为延迟归还支付罚金)。由此,奈飞成了最早取得成功的平台之一,它改变了这个行业,并最终成长为巨头。
1999年,也就是奈飞正式成立的那一年,他们一共只有239 000位订阅用户;仅仅4年之后,他们的订阅用户数量就达到了100万。而真正改变游戏规则的是哈斯廷斯做出的第四个决定——2007年,他决定用宽带流量取代邮政寄送DVD服务。2018年秋季,奈飞的订阅用户数量飙升到1.37亿,而且专家预测,未来几年订阅用户数量可能还会再翻一番。
现在,奈飞已经成了流媒体领域无可匹敌的巨头。全网51%的流媒体订阅量都属于奈飞,这为他们带来了超过45亿美元的年收入和1 500亿美元的市值。奈飞也正在成为内容提供者,很多很多内容的提供者。2017年,他们在原创电影和电视节目制作上花费了62亿美元,超过了哥伦比亚广播公司(40亿美元)和HBO(25亿美元)等传统的大型制片公司,只略低于时代华纳(Time-Warner)和福克斯等大型竞争者(它们每年的投入为80亿到100亿美元)。不过仅仅一年后,奈飞在内容方面的投入又翻了一番,达到130亿美元,跻身大型制片公司之列。
与投资总额相比,真正重要的是奈飞用这些钱做了什么事情。2018年,美国的六大电影公司总共发行了75部电影,而奈飞则用它的“战争基金”制作了80部新故事片和700多集新电视剧。
以上这些数据也正是我认为讨论指数型技术对娱乐业的影响应该从奈飞开始的原因。事实上,在任何关于指数型技术颠覆性的“编年史”上,都少不了奈飞对百视达造成毁灭性打击的这个经典故事。当初,百视达放弃了以5 000万美元收购奈飞的机会,这个事实完全可以与柯达公司未能充分利用数码摄影技术相提并论(讽刺的是,数码摄影技术正是柯达公司发明的)。不过,奈飞对百视达的打击本质上不过是一次技术融合的结果。
在“消灭”家庭视频的时候,奈飞利用了互联网这个新技术,让美国人可以舒舒服服地躺在沙发上租DVD看。如今,奈飞利用一组正在融合的指数型技术,也就是宽带技术和人工智能技术,挑战价值上万亿美元的娱乐生态系统。
当然,奈飞并不是在孤军奋战。
流媒体平台正处于爆炸式增长过程中。大多数大型科技公司都加入到了这个行列,这也是技术融合导致市场融合的一个副产品。2018年,苹果在原创节目上的花费超过10亿美元,而亚马逊也投入了50亿美元。Sling、YouTube以及葫芦等公司,甚至还有那个以修理割草机出名、在Facebook上有300万粉丝的家伙,都来与好莱坞争抢同一块蛋糕了。
在这一章的其余部分,我们将探索在未来10年中,不断融合的指数型技术将如何重塑娱乐业。有三个重要的转变正在发生,我们可以分别从“谁”、“什么”和“在哪里”三个角度来讨论,也就是说,我们可以考察一下是谁在制作内容、制作什么类型的内容,以及我们是在哪里观看、体验这些内容的。
自从银幕出现以来,娱乐产品一直把控在少数几家资金充足、控制严格的制片公司、院线和广播电视网络公司中。电视广告收入和电影票房加起来,每年创造的总收入接近3 000亿美元。通过囤积一些稀缺的资源——技术、人才、融资和分销渠道,少数好莱坞电影公司和电视网络公司实际上牢牢控制了所有这些收入。
不断加速的指数型技术天生有一种使稀缺资源变得富足的方法,对娱乐业而言也不例外。接下来,我们来看看娱乐业三大转变中的第一个,即制作内容的人的转变。
超级内容生产者的崛起
21世纪初,随着视频摄像机、编辑软件和录音机逐渐成为手机的标准配置,人们开始做一些事后看来很明显应该会做但事前根本没有预料到的事情,即使用这些工具来生产内容。业界为这些自制内容创造了一个新的术语:用户生成内容(user-generated content,简称UGC)。博客代表了这种内容交流的书面形式,播客代表了其音频形式。与此同时,自制视频也带来了一个问题,没有任何一个地方可以被称为这些用户生成的视频的“家”(一个可以自由共享一切的中心)。
这一问题引得各大公司竞相填补这一空白。谷歌本来有很大机会一马当先,作为一家科技巨头,他们迫切希望成为第一,但无奈他们提供的视频共享服务落入了法律的泥沼。谷歌公司的律师在面对知识产权问题时畏首畏尾,不知道如果用户发布了本不属于原创的内容时,谷歌应该怎么做。
YouTube公司则没有考虑这个问题。当时,这家公司只有三个人,他们都是Pay Pal公司的前员工,他们只有一个想法、一个车库,还有一张信用卡。这家公司太小了,小到他们根本无暇关注律师有什么看法。
当谷歌还在犹豫谁可以发布什么内容的时候,YouTube就已经爆发了。第一个视频是由YouTube联合创始人贾韦德·卡里姆(Jawed Karim)自己上传发布的,它毫不起眼,标题为《我在动物园》(Me at the Zoo);但在不到6个月后,一段以巴西足球明星罗纳尔迪尼奥(Ronaldinho)为主角的视频就成为第一个获得100万点击量的视频。红杉资本(Sequoia Capital)当即决定注入350万美元的投资,YouTube用这笔钱升级了网络,巩固了他们在业界的地位。一年多后,谷歌认定,联合应该比竞争更加合算,于是他们关闭了自身的视频分享服务,并斥资16.5亿美元收购了YouTube,认为该网站代表了“互联网发展的下一个阶段”。
这一说法显然过于轻描淡写了。
现在,每一天都有数十亿人在YouTube观看海量的视频。对于年轻一代来说,YouTube已经完全取代了电视,成为他们自己选择的媒体。与此同时,由于YouTube实现了内容分发的大众化,使得每个用户都能生产自己的内容,这也打破了好莱坞对内容生产者的长期垄断。其中一个后果是,社交媒体上出现了一些很有影响力的人,他们成了新一代的超级内容生产者,以非传统的方式对传统媒体构成了严峻的威胁。
以烹饪节目为例,现在,戈登·拉姆齐(Gordon Ramsay)和雷切尔·雷(Rachel Ray)等名厨的竞争对手是YouTube上的“与宝宝一起吃饭”(Bingingwith Babish)等视频制作者。在这类视频中,博主安德鲁·雷亚(Andrew Rea)在每一期都会为100多万名观众重现著名电视节目和电影中的美食。在《与狗一起做饭》(Cooking with Dog)的系列视频中,一位沉默的日本女性会在厨房里做出种种出格行为,而她的贵宾犬弗朗西斯则负责在一旁“讲述”,这一系列视频逗乐了数百万人。还有80万人会经常收看《酒醉厨房》(My Drunk Kitchen)这档节目。
这些拥有超高人气的短视频博主获得了大笔的收入。2018年,YouTube用户洛根·保罗(Logan Paul)依靠他的喜剧视频博客获得了1 450万美元的收入,而游戏玩家丹尼尔·米德尔顿(Daniel Middleton)的收入更是高达1 850万美元。音乐家也通过YouTube赚到了钱,甚至孩子们玩玩具的视频也会带来不菲收入。7岁的瑞安(Ryan)是《瑞安玩具评论》(Ryan Toys Review)系列视频的主角,他的年收入超过了2 200万美元,在《福布斯》推出的“收入最高的YouTube博主”排行榜上名列榜首。此外,由于没有什么比钱更能赚钱,风险投资家也加入了进来。前期风险投资(Upfront Ventures)、科斯拉风险投资(Khosla Ventures)、首轮资本(First Round Capital)、小写资本(Lowercase Capital)、硅谷天使投资基金(SV Angel)等,都把赌注押在了用户生成内容上,这意味着这些超级内容生产者的吸引力已经与好莱坞大牌明星不相上下了。
随着技术的不断融合,颠覆性破坏的规模只会越来越大。智能手机摄像头作为工具使无数普通用户成了内容生产者,而像YouTube这样的平台为这些内容生产者提供了一个平台,一个获得报酬的途径。现在还有了像Bambuser这样的基于应用程序的服务,可以帮助任何人构建自己的直播网络,这就使得内容生产者(创作者)可以进军整个娱乐生态系统。
区块链还将进一步放大这个过程。由于区块链允许艺术家为自己的作品创造不可更改的数字记录(这将保证自己的作品不会被盗版),而且由于其交易成本极低或根本不存在,区块链还会将我们带到内容创作的传奇应许之地:微支付。这正是作家、艺术家、电影制片人、漫画家和记者自互联网出现以来一直在等待的东西。直接将自己的作品传达给自己的粉丝,无须经过任何中间人。这将导致一个真正的、有创造力的精英阶层的出现——至少理论上是这样的。
现在,无数新的内容平台正在涌现,它们都试图从这一趋势中分一杯羹。利基市场无处不在。我们可以在网络上看到或听到其他人做的任何一件事情——编写软件、制造机器人、“吸”猫,只要你想看,就可以找到相应的频道、还可以点播或直播,并有相应的应用程序支持,保证粉丝互动达到新的水平。这里最不寻常的,不仅在于对创作者的超级赋能,而且还在于获得赋能的创作者类型十分广泛。
2016年6月,一部极其怪异的短片《春光》(Sunspring)以线上的方式发行,这是有史以来第一部由人工智能编写剧本完成的电影。制作人员给这个由神经网络驱动的人工智能“灌输”了数百部科幻电影的剧本,让它先学习再自由地编写剧本,决定故事的情节走向。两个月后,二十世纪福克斯电影公司(Twentieth Century Fox)发布了即将上映的惊悚片《摩根》(Morgan)的预告片,它也是由人工智能协助编剧的,而这次出马的是IBM公司的“沃森”。
沃森先“看”了100部恐怖片的预告片,然后对其进行了视觉、听觉和成分分析,试图全面了解人类心目中的“恐怖”到底是什么。在对《摩根》进行同样的分析后,沃森识别出了这部电影的关键片段。最后,它成功地把制作预告片的时间从10天缩短到了1天,其中人工参与的部分,就是预告片导演需要把沃森选出的这些片段以一个连贯的顺序拼接起来。
电影并不是唯一一种进入机器时代的艺术形式。佐治亚理工学院的研究人员开发出了“谢赫拉莎德”(Scheherazade),利用这个人工智能,用户就可以在视频游戏中创建自己的冒险故事。现有的由人工智能驱动的视频游戏,都会在开始时设定固定数量的数据集,因此后续只会发生固定数量的可能故事线,而谢赫拉莎德支持用户体验到无限的情节转折点。它实际上就是一个无限冒险机器,只不过它并不是完全依赖于算法的。谢赫拉莎德可以从人类身上获得帮助,游戏内容的创建是通过人工智能和游戏玩家群体之间的协作完成的。
这样也就把我们引向了娱乐业的第二大转变,即创作内容的转变。
从被动到主动
娱乐业的下一个重大转变将会发生在内容生产方面。在本章接下来的内容中,我们将会看到,内容创作将变得更加强调协作化、沉浸式和个性化。我们将依次对这些问题进行分析,首先从“被动”媒体的消亡说起。被动媒体意味着信息的流动是单向的,比如传统的报纸、杂志、电视、电影和书籍(包括你面前的这本书)。主动媒体则相反,这一名词意味着信息是双向流动的,而且用户是有发言权的。
主动媒体并不是全新的事物。许多公司现在都已经把用户当作开发人员来使用了。例如,维基百科的“带有用户生成的游戏内容的视频游戏”页面上列出了95个独立游戏的名单。那当然是一个不完整的名单。像《毁灭战士》(Doom)和《马里奥制造》(Mario Maker)这样的热门游戏,其实都包含了很容易使用的地图编辑器,任何人都可以创建自己的关卡并在网上分享。而像谢赫拉莎德这样的人工智能型游戏系统,将这种交互性提升到了一个全新的高度。
除了游戏之外,还有其他媒体。
例如,混搭机器(MashUp Machine),这是一个由人工智能驱动的参与式故事创作平台。由于能够将机器智能与人类智能很好地融合起来,应用程序可以基于这两者创建交互式动画电影。这是一条双行道。而当用户自定义内容时,人工智能会学习他们讲故事的风格与细节,并且会提出建议、帮助用户完成创作。
这种交互式创作产出的作品,质量可以持续提升。机器在帮助我们讲故事的过程中,也会成为更好的“说书人”。不久之后,人工智能就将不满足于只通过扫描给定的内容、搜索相关的话题和表情包来产生更多的内容。相反,人工智能将消化掉整部小说、消化掉整部电影,并且(通过给它输入足够的故事进行训练)懂得如何分辨高下、去芜存菁。
与此同时,人类却可能正在失去这种技能。深度伪造就是一个明显的例子。这种首先出现在政治和色情领域的令人不安的趋势已经蔓延到其他娱乐领域。这意味着一种全新的协作型主动媒体的产生。早在2018年,加利福尼亚大学伯克利分校的研究人员就开发了一种人工智能动作转移技术,可以将专业舞者的身体叠加到业余爱好者的身体上,将前者的流畅动作与后者日常的笨拙舞步结合为一体。这意味着任何人都可以成为弗雷德·阿斯泰尔(Fred Astaire)、金杰·罗杰斯(Ginger Rogers)或梅西·埃利奥特(Missy Elliott)。获得具有一体性的深度伪装,关键在于,它已经实现了大众化。
Deepfake 1.0版使用的是人工智能驱动的逐帧图像传输技术,需要多个传感器和摄像头。但是现在,要让自己成为一位舞蹈家,你只需要利用好智能手机的摄像头就行了。
这些“赝品”为娱乐业带来了大量的机会,比如“起死回生”。好莱坞的电影公司还要多久才能让罗宾·威廉姆斯(Robin Williams)、玛丽莲·梦露(Marilyn Monroe)或图帕克·夏库尔(Tupac Shakur)起死回生?观众多久之后才能看到有老明星参演的新电影?我们的直觉是,很快。
接下来我们来讨论一下深度伪造术“真实的伪造”这一面:使用电脑来创造我们自己的替代版本。现在市面上已经有很多种由人工智能驱动的个人助理了,例如Siri、Echo和Cortana。试想一下,你刚刚和你的另一半发生了口角,你觉得自己非常需要一些建议。然而,如果在这种情况下你说“嘿,Siri,我的男朋友生我的气了”,你得到的反馈可能只是“我不知道这该怎么回应”。但如果你的个人数字助理是自助专家励志演说家托尼·罗宾斯又会发生什么呢?
其实这个场景已经不用去想了。2018年,罗宾斯已经与Lifekind公司开始了合作,后者是一家专门为真人制造人工智能“分身”的公司。这个分身具备非常真实的音频和照片模拟,从举止到记忆,让人难以区分真假。为了“重新创造”一个罗宾斯,Lifekind将800多万张图片及他的所有工作成果,包括书籍、视频、博客、播客和现场活动的录音带等,整合在了一起,用罗宾斯自己的话来说,结果得到的是“一个可以操作的人工智能,而不是机器人。它虽然暂时还不能成为一位治疗师,但是我肯定会让这一点“最终”成为现实……音频部分已经非常不错了,连我妻子都分辨不出真假。而最有趣的部分是真实的人工智能。这是一个非凡的机会,能够刻画一个人如何思考、感受或创作。它的记忆力让我相形见绌。而且它拥有我所有的(自助)思维模型,所以它可以看着你们……然后用一个特定的模型确定你们中20%的人是有兴趣的,30%是兴奋的,40%是投入的。它可以实时地做到这一点”。不仅内容变得比以往任何时候都更加具有“主动性”,这些主动性还可以将人类与机器智能融合在一起,将娱乐行业扩展到更广阔的新领域。
全息甲板,就在这里!
朱尔斯·乌尔巴赫(Jules Urbach)是和《星际迷航》制片人吉恩·罗登贝瑞(Gene Roddenberry)的儿子罗德·罗登贝瑞(Rod Roddenberry)一起上高中的。两人是亲密的朋友,几乎每天都在交流。那么他们都谈了些什么呢?“全息甲板,”乌尔巴赫说,“在很多时候,我们都在谈论全息甲板。”
全息甲板最早是在《星际迷航:下一代》(Star Trek: The Next Generation)中出现的。它可以使用全息图来产生用户想要的任何体验。这是一个完全沉浸式的环境,从功能的角度看与现实生活难以区分。乌尔巴赫对全息甲板的痴迷促使他确定了一项使命:在现实世界中建造一个全息甲板。
在完成使命的过程中,他接触了电子游戏,然后是3D游戏,最后是3D渲染。乌尔巴赫与同伴共同创立了Otoy公司,该公司致力于将渲染从桌面转移到云端。在他们的技术面世之前,像《人猿星球》(Planet of the Apes)这样主打特效的电影,需要超级计算机运行好几个小时,才能完成一帧画面。而在有了Otoy公司的软件之后,这一切都可以通过WiFi连接到云端的平板、手机上实时完成。
接下来,乌尔巴赫又与其他人共同创立了LightStage公司,这是一家专门从事360度图像捕捉的公司。这项技术当然也能把人变成全息图,从而为Otoy的应用程序提供特效所需的基本图像。
在全息甲板成为现实之前,还有两个障碍需要克服。其中最大的一个障碍是光。当看到一个物体时,我们看到的其实是从这个物体上反射回来的数以万亿计的光子。因此,如果能以合适的角度和强度,人为地向观看者的眼睛投射数万亿个光子,我们就能重建任何现实。
现在,欢迎来到光场实验室(Light Field Lab),这是一家总部位于加利福尼亚州的初创公司,它开发了有史以来第一个能够产生数万亿光子的显示技术。虽然他们最初生产的显示器只有4×6英寸宽,但是已经能够投射出2英寸“厚”的全息图像了,而且在30度的范围内都能看到。他们还可以将这些立方体组合成18英寸的显示器,然后再将这些显示器组合成墙体……光场实验室可以用这些立方体填满整个房间——墙壁、地板和天花板。每一个显示器都能在3米之外投射出全息图。这简直就是《星际迷航》中的全息甲板!
或者退一步说,这已经相当接近《星际迷航》中的全息甲板了。由于全息甲板上的物体看上去摸起来也像真实的物体,所以另一个障碍是触觉。在这方面,光场实验室也已经取得了很大的进展。就像他们用光让你去“看”一样,他们可以用声音让你去“感觉”。当超声波(医生使用的那种超声波)被投射到上述房间里面时,声波本身就能给物体赋予一种真实的存在感。它虽然不具有真正的物体的重量,但是它是有形的。将Otoy公司的软件、LightStage的图像捕捉和光场实验室的投影仪结合起来,我们就拥有了构建全息甲板的所有基本组件——这是迄今为止最具沉浸感的娱乐形式。
强烈的沉浸感标志着内容生产的第三个转变,这种转变与注意力密切相关。要吸引一个人的注意力,主动参与胜过被动引导,沉浸式体验又胜过主动参与,原因在于感官输入。一项活动所涉及的感官越多,我们对它的关注度就越高。
这就是众多公司都在努力开发能够把我们的感官带入虚拟世界的各种工具的原因。让我们有触觉的触感手套已经出现了,而且技术越来越精细。还有将嗅觉视觉技术引入电视的气味发射装置,以及在舒适的客厅里提供音乐会式体验的3D音响系统。触觉椅现在可以倾斜、偏转、颤抖和摇摆,而一体式全功能跑步机则可以让我们随心所欲地奔跑、舞动、跳跃。
斯坦福大学神经学家大卫·伊格曼(David Eagleman)所做的研究则更进一步。他与《第二人生》的创作者菲利普·罗斯代尔(Philip Rosedale)合作,将触觉从手扩展到了整个躯干。罗斯代尔创办的初创企业高保真公司(High Fidelity),致力于创造一个完全沉浸式的虚拟现实世界。而依格曼的初创公司NeoSensory开发出了“exoskin”,这是专为完全沉浸式的虚拟现实世界而设计的。从表面上看,exoskin就是一件长袖衬衫,只是在手臂、背部和腹部每隔几英寸安装了一些微型马达。依格曼解释说:“穿上exoskin之后,如果虚拟现实世界下起了雨,你就可以感觉到雨滴。或者如果你被另一个人的化身触摸,你就可以感受到他们的触摸。”整个过程中的信号传输速度非常快,穿着这件衬衫的人瞬间就能感受到。
位于洛杉矶的“梦景”公司(Dreamscape)将触觉感应和沉浸式虚拟现实结合了起来,他们拥有的技术能让体验者享受到一种奇异的情调和感受,比如在深海中与蓝鲸同游,或者在外星动物园里抚摸动物。现在,梦景公司已经与AMC影院展开了合作,相信参与式观影取代大银幕大片成为暑期档最佳惊险刺激之旅的日子已经不远了。
我相信,乌尔巴赫的全息甲板将带来下一个巨大的飞跃。使用超声波来提供触觉,可以提供同样水平的触觉感知,而且不需要烦琐的手套。驱动全息甲板的人工智能将会拥有“情感意识”,它所创造的环境将具有令人难以置信的交互性,而这就意味着我们在娱乐内容生产方面的三大主要转变都将合并为一种体验。这标志着娱乐业未来的巨大变革。但是,这并不是故事的最终结局。
一切还将变得非常个性化,真的真的非常个性化。
完全个性化
2028年的一天,你结束工作,整个人感觉很累。你只有不到45分钟的时间可以用于准备晚餐,但是你迫切地想坐下来喝一杯,放松一下。你会拿起遥控器,打开电视吗?不会的。你会对漂浮在咖啡桌上的全息CNN频道感兴趣吗?也不会。好消息是,这两个问题其实都不重要——因为你的人工智能助手已经知道你需要什么了。
你的人工智能助手不仅可以陪伴你度过一整天,现在它还能够监控和理解你的情绪。它相当详细地记录了你情绪的起起伏伏。今天早上,它在智能镜中捕捉到了你拉长的脸,听到你和妻子在午餐时带着怨气的对话,还发现你在搭车回家的路上忽略了弟弟的电话。最后一点尤其能说明问题,因为这个人工智能助手已经陪伴你很长时间了,它知道,你只有在真正觉得有压力的时候才会忽略弟弟打来的电话。此外,传感器也一直在跟踪你的神经生理学指标变化,所以人工智能助手不仅了解你情绪变化的细节,还知道这些细节如何影响了你的身体和大脑。
重要的是,人工智能助手可以根据这些信息来采取行动。
人工智能主动干预的结果是,当你走进客厅时,你最喜欢的欧文·威尔逊(Owen Wilson)的喜剧片段就已经投射在墙上了。这里非常特别的一点是,你其实从来都没有明确表达过自己是欧文·威尔逊的粉丝——在过去的5年里,你只看了他的几部老电影,但可以确定的是,你很喜欢他的表演。虽然那些电影的情节并没有那么令人难忘,但是每一部电影中都有不少可以让你捧腹大笑的场景。你的人工智能助手注意到了这些,而且它还知道(因为它一直在跟踪你的情绪变化的轨迹),大笑是让你的情绪变好的“快速通道”——在此之前,当你承受了较高的压力时,大笑能让你觉得更好的情形占到了78.56%。
因此,你看到了欧文·威尔逊的精彩镜头剪辑,其中夹杂着其他一些风格相同的喜剧电影片段。在这个视频片段快结束时,你的人工智能助手还插入了几段你和妻子一起大笑的手机视频。幸福的回忆提醒着你,什么才是真正重要的。这个“混搭疗法”的效果很好。在你小酌一杯之后,坏情绪已经完全消失了。你和妻子通过坦诚的交流解决了分歧,然后一起出门吃晚饭。这时,你觉得自己的精神状态非常好。
这些场景中所用的技术,现在大部分都已经出现了,它们被冠以“情感计算”的标签,或者被称为“教授机器理解和模拟人类情感的科学”。这当然也是一个技术融合的案例,因为这是一个位于认知心理学、计算机科学和神经生理学交叉地带的新领域,结合了人工智能、机器人和传感器等正在加速发展的技术。情感计算已经集成到了网络教学应用程序中,如果学习者感到无聊,人工智能就会调整讲解风格;它也渗透进了机器人看护中,使机器人看护的质量大幅提高;它还应用到了社会监控领域,比如人工智能汽车,一旦发现司机生气了,相关系统就会采取额外的安全措施。而它最大的影响是在娱乐领域,因为那里所发生的一切都越来越个性化了。
人的面部表情、手势、眼神、声调、头部动作、说话频率和持续时间,都是富含情感信息的信号。如果将下一代传感器与深度学习技术很好地结合起来,人工智能就可以读取这些信号,并利用它们来分析用户的情绪。重要的是,所需要的基本技术都已经出现了。
Affectiva是由麻省理工学院情感计算小组组长罗莎琳德·皮卡德(Rosalind Picard)创建的一家初创公司,它开发了一个可供游戏公司和营销行业使用的情感识别平台。如果用户觉得困惑或沮丧,那么这个技术平台就会告诉客服聊天机器人,同时为广告商提供一种测试广告情感效果的方法,为游戏公司提供一种实时调整内容的方法。在惊悚游戏《别介意》(Nevermind)中,Affectiva提供的技术能够通过面部表情和生理反应来捕捉玩家的焦虑感。当系统发现用户感到害怕时,游戏就会加码——增加挑战性的任务和超现实的内容来提高刺激性。
另一家情感计算初创公司光波(Lightwave)的技术不仅可以捕捉个人的情绪状态,还可以捕捉整个群体的情绪状态。思科公司已经利用相关技术来充当一个创业投资大赛的裁判了,它还帮助音乐节目主持人保罗·奥肯弗德(Paul Oakenfold)在新加坡的一场音乐会上提高了听众的参与度,并在《荒野猎人》(The Revenant)预热期间帮助测试观众的反应。
情感计算也在向移动化的方向发展,这意味着手机可以根据现实世界中发生的事情来提供内容——我们的情绪、位置、同伴、同伴的情绪等。一些初创公司,比如Ubimo和Cluep,可以提供“情感企业家”所需的一切:从情感应用程序开发平台到高度个性化的情感内容交付服务。
随着融合的继续,一种新的高度个性化的可能性组合出现了,所用内容,不仅包括那些预先设定好试图适应我们的情绪的内容,还包括大量被单独创造出来、特别适应我们的情绪的内容。
同样,由人工智能驱动的、能够选择“用户自己的冒险故事叙述风格”的浸入式视频游戏也已经闯入传统媒体的领地。2018年5月,二十世纪福克斯公司宣布将把20世纪80年代的“选择自己的冒险故事”系列丛书搬上大银幕。在这个系列电影中,观众可以用他们的智能手机投票决定自己想要的电影结局、故事情节,还可以设定情节转折点等。然而不幸的是,由于必须利用智能手机来做出选择,因此也可能会导致所谓的“参与杀手”的出现——《好莱坞记者报》(Hollywood Reporter)称这种做法“以最糟糕的方式对影院观影体验造成了极大的破坏”。在我看来,利用智能手机接口只是一个临时性的解决方案。不久之后,有了影院感应和情感计算,情感驱动的故事讲述将成为观影体验的另一部分。
未来的人工智能将比我们更了解自己对故事情节的偏好。例如,你可能会记得自己喜欢看什么电影,但是你的人工智能知道你为什么喜欢它。通过语义分析和跟踪生理反馈,它能解析一段看似无关痛痒的对话是怎样变成一个非常有感染力的怀旧时刻的。它会记录你的心率、眨眼率、瞳孔扩张反应,知道你在看什么、你没有看什么。这样的数据洪流意味着,即便在选择你自己的冒险故事时,不久之后我们也不会是那个做出选择的人。人工智能会根据我们的经历和过去、神经生理学指标、地理位置、社会偏好和所期望的沉浸程度来匹配情感,然后在极短的时间内定制内容来匹配所有这一切。
这就把我们带到了接下来要讨论的最后一个转变,不是谁在制作内容或者制作什么样的内容,而是我们将在哪里体验这些内容。
娱乐新天地
关于故事的故事:一个简短的概述。历史学家认为,讲故事本身始于人类祖先在篝火旁所做的活动,同时他们也确信,面向大众的“讲故事”行为起源于印刷品的出现。书籍、报纸、杂志是最早出现的大型信息载体,它们占据了人类娱乐世界的中心舞台达400年之久。后来出现了广播,它提供了一种前所未有的亲切感和即时性。无声电影和有声电影为这种亲切感提供了强有力的补充,而只有广播是第一种能够让整个国家的人都能一起收听的媒体。
黑白电视创造了一个即时共享视觉效果的时代,接着是彩色电视,它与其说是对黑白电视的升级,还不如说是征服。这些巨大的盒子垄断了客厅的中心位置超过半个世纪。然后出现了等离子屏幕。在一个又一个消费电子展之后,这些屏幕变得更薄、更便宜,分辨率也更高了。接下来,在摆脱了电线的束缚之后,这样的屏幕变得铺天盖地、无孔不入。那么,有什么事物能够颠覆目前的这种颠覆性技术呢?
我们先来看看Magic Leap公司提供的技术增强现实功能,以及该公司宣告的目标:彻底消灭屏幕。他们的第一代增强现实眼镜看上去只是一种相当呆板的硬件,所以我们得出的结论只能是,这种产品在无意中发挥了一种预言性的作用。但是在那以后,增强现实技术变得越来越受推崇,人们戴眼镜的理由也越来越充分。但是Magic Leap公司的志向不限于此,他们想要把屏幕非物质化,把这种眼镜放在任何你希望它会出现的地方——卧室的墙壁上、手掌中、布鲁克林大桥的一侧等。
那么,有什么可能会颠覆智能眼镜这种颠覆性的技术呢?利用增强现实技术开发的智能隐形镜头怎么样?你将不再需要戴头盔,因为屏幕就安装在你的眼角膜上,影像可以直接投射到你的视网膜后面。有什么可能会颠覆这种智能隐形镜头呢?全息甲板怎么样?你的眼睛将不再需要借助任何工具。那么,有什么可能会颠覆全息甲板呢?嗯,正如史蒂夫·乔布斯经常对我们说的,等一下,等一下……还有一件事,是的,总会有下一个颠覆性的创新出现。
让我们再仔细看看。
首先,对于那些仍然想要一个屏幕的人来说,相关技术也正在发生变化。有机发光二极管屏幕(OLED)已经开始全面取代发光二极管屏幕(LED)了。它最初受到人们青睐的优点是图像分辨率高,现在被看重的则是柔韧性强。LG公司已经生产出了一个19英寸的可以卷成圆筒的OLED显示屏。其他公司也紧随其后。我们已经在手机上看到了类似的东西,例如,用可延展的石墨烯代替坚硬的硅,中国的研究人员开发出了一种可以缠绕在手腕上的智能手机,看上去就像一只可佩戴的手镯。后面应该很快就会出现能够提供触觉反馈的触摸屏。通过使超低水平的电流流回人体的皮肤,现在的触摸屏已经能够轻柔地“触摸”用户的皮肤了。
但是,屏幕有一个无法打破的限制,那就是它总要占据一定的空间。屏幕意味着你要在固定的地方观看娱乐节目—在客厅或在当地的电影院中。当然,我们也可以通过平板电脑和智能手机在某种程度上获得移动性,但是代价是屏幕太小,参与度不高。如果我们观看的内容是为手机大小的屏幕而设计的,或者是为邮票大小的屏幕设计的,那么我们就更有可能因注意力分散而脱离故事场景。随着增强现实技术的发展,我们已经开始脱离屏幕了。
这种转变正在迅速到来。未来5年,增强现实技术预计将会创造一个900亿美元以上的新市场。苹果公司首席执行官蒂姆·库克(Tim Cook)在接受《独立报》(Independent)采访时表示:“我认为增强现实技术和智能手机一样是一个伟大的创新。我们的智能手机适合所有人,苹果手机并不是针对特定的人群、国家或垂直市场而设计的,它适合所有人。我认为增强现实技术也是如此,它的市场是极其巨大的。”
这种技术的发展给我们带来的是一个建立在常规现实之上的信息层,世界本身变成了屏幕。如果你想玩增强现实版《星球大战》游戏,你可以在上班的路上,在储物间、餐厅、浴室等地方与“帝国”奋勇作战。
2016年,我们已经享受到了第一道增强现实“大餐”。任天堂发布了《精灵宝可梦Go》,有史以来最伟大的卡通人物《火鸡射击》(Turkey Shoot)随之诞生。《精灵宝可梦Go》拥有500万的日活跃用户、6 500万的月活跃用户,获得了超过20亿美元的收入,这种体验的受欢迎程度当然是有目共睹的。在那之后,增强现实应用程序出现了爆炸式增长。曾经又厚又大的智能眼镜,现在已经变得又薄又轻了,而未来它们还会变得更小。从谷歌到三星,再到魔幻视觉(Mojo Vision)等资金充足的初创公司都在开发增强现实隐形眼镜,这种隐形眼镜可以让你不戴眼镜就能实现抬头显示等功能。
而对于那些对增强现实隐形眼镜不感兴趣的人来说,还有其他选择。乌尔巴赫预计,到2020年,他的全息甲板就会出现在一些迪斯尼风格的主题公园中,可能还会出现在超级富豪的娱乐室里。但是,如果真的到了人们可以自行修补大自然自身的现实投射系统人脑的那一天,谁还需要全息甲板呢?
这也就是我们接下来要讨论的脑机接口的世界。有了增强现实隐形眼镜之后,我们可以制造出一个具有信息层的无缝界面。有了触感手套之后,我们就可以在模拟场景中拥有真实感。如果模拟不是在大街上进行的,而是在一个房间里进行的,那么,加入光子和超声波层,这种体验会令你觉得身临其境。而在有了脑机接口之后,我们就可以用人类通常所用的创造现实的方式来创造现实了,也就是我们的大脑。
脑机接口技术的开发最初是为了帮助患有闭锁综合征(locked in syndrome)的患者进行交流的,它使用脑电图(electroencepha logram)传感器来读取经头皮传出来的脑电波,实现了一个无须用手、直接用精神控制的内容界面。现在,我们已经看到基于脑电图的脑机接口设备开始应用到游戏领域了。研究表明,在传统的街机游戏(如“俄罗斯方块”和“吃豆人”)和多人游戏(如《魔兽世界》)中使用这种技术是可以获得成功的,而我们现在也有了一些新型的借助脑机接口技术开发的游戏,例如精神平衡(MindBalance)和细菌捕杀(Bacteria Hunt)。
华盛顿大学的研究人员于2017年发布了大脑网络(BrainNet),这是首个允许多人同时参与的、通过思想进行脑对脑交流的网络。通过使用脑电图仪来“读取”脑信号,通过经颅磁刺激仪来“写入”脑信号,实验参与者可以相互连接起来,一起玩改良版的俄罗斯方块游戏。在这个游戏中,参与者通过脑电图仪、经颅磁刺激仪和一组闪烁的灯泡进行交流和合作,这标志着一种新的“群体思维游戏”的诞生,也是我们刚刚开始探索的科技最前沿。
我们也看到,脑机接口技术不仅进入了游戏领域,也进入了传统电影领域。2018年5月,英国艺术家兼导演理查德·拉姆丘恩(Richard Ramchurn)发布了一部27分钟的短片《那一刻》(The Moment)。观看这部电影时,你只要戴上一个相当便宜的头戴式脑电图仪(价格为100美元),电影的内容——场景、音乐和动画,每一次都会因你的大脑内部发生的事情的不同而不同。
脑机接口意味着,娱乐内容不仅可以根据我们的情绪来定制,还可以根据我们的大脑来定制。脑机接口相当于在电脑和大脑皮层之间建立了直接连接。虽然这种连接的发展可能会超出我们一直关注的10年的时间范畴,但是我们必须在这里指出它对内容创作者意味着什么。媒体公司和神经科学实验室迟早会合并,这是不断融合的指数型技术的产物,因为技术的融合会导致市场的融合,最终形成一个生活在今天的人完全不了解的娱乐新天地。
精彩评论