category
AI summary
tags
password
summary
date
icon
status
字数统计
type
slug
orgsrc
URL
机械化(Mechanization)→ 自动化(Automation) → 自主化(Autonomization)是所有人类科技的演进方向
在准备复盘 2024 XR 这一年的时候,刚好看到一个有趣的网站:https://calculatingempires.net/
Calculating Empires(计算帝国) 由 Kate Crawford 和 Vladan Joler 于 2023 年创作,是一个规模极为宏大的研究可视化项目,这个项目专注于通过通信、计算、分类以及控制这四个主题,来呈现五个世纪以来技术与社会结构的共同发展演变情况。该项目对自 1500 年以来的殖民主义、军事化、自动化的技术模式进行追溯,其目的在于帮助人们在更为深厚的历史背景之中理解当下技术的现状,从而绘制了一幅《自公元 1500 年以来的技术与权力谱系》的可视化图谱。
通过回顾信息、媒介、人机交互和生物统计学这 500 多年的变革历程,我们可以清晰地看到扩展现实(XR)发展至今的轨迹,并由此展望其未来发展方向。
信息与媒介技术
正如空气和食物是人类生存的基本需求一样,信息和媒体也是人类社会生存和发展的基础。没有信息的交流和传播,人类社会将无法正常运转。在 17 世纪剧场技术(Theatre technology)和机械自动装置(Automata)的技术基础之上,逐渐发展出动画技术、摄影技术,并最终汇集为人类历史上最伟大的信息与媒介技术之一:电影(Film)。
- 1895 年,法国的奥古斯特·卢米埃尔和路易·卢米埃尔兄弟发明了“活动电影机”,并在巴黎首次公映了他们摄制的短片,如《火车进站》和《工厂的大门》,这一天被认为是电影正式诞生的标志。
- 1873 年,使用 QWERTY 布局的第一台商用打字机成功投放市场;QWERTY 键盘布局的发明时间可以追溯到 1868 年,由克里斯托弗·莱瑟姆·肖尔斯(Christopher Latham Sholes)申请了专利。
多媒体与人机交互
电视机(Television)的发明对电影产业产生了深远的影响,促使电影在内容、技术、制作、经济和文化等多个方面不断变革和发展。电影产业在与电视的竞争与合作中,不断探索新的可能性,为观众提供了更加丰富和多样化的观影体验。简言之,电视使信息以数字化的方式变得便利,实现触达(伴随信息技术的发展,进一步流向个人电脑 PC、互联网、手机);而电影则走向沉浸, 满足用户的视听体验:
- 1962 年,电影摄影师莫顿·海利格(Morton Heilig)发明了名为 Sensorama 的虚拟现实机器,并为其申请了专利。这台设备被认为是虚拟现实(VR)的原型机,它通过多通道仿真体验系统,包括视觉、声音、触觉和味觉的模拟,为用户提供了一种沉浸式的体验。
- 1968 年,当时道格拉斯·恩格尔巴特(Douglas Engelbart)在美国斯坦福研究院的演示中首次展示了鼠标、图形界面(GUI)、窗口和图标等概念。
与此同时,人机交互界面(Communication between flesh and machines)在 1950~2000 的 50 年间迅速完成了从 QWERTY 打字机到键盘输入命令行(CLI),再到图形界面、操作系统、浏览器(互联网)的演进,直至来到触屏时代:
- 2005 年,苹果公司收购了FingerWorks公司,获得了多点触控专利技术和产品,并将其应用在了即将推出的产品上。
- 2007 年,第一代iPhone发售,它重新定义了智能手机,触摸屏开始逐渐走进并融入我们的生活,成为不可或缺的一部分。
生物统计学
人类对自身生物特征的测量与统计技术(Biometry),是社会高效组织运作的关键要素之一:通过精确地识别和分析个体的生物特征,如指纹、面部识别、虹膜扫描等,为身份验证、安全监控和数据管理提供了可靠的基础。这种技术不仅提高了社会系统的安全性,还优化了资源分配和人员管理,确保了社会运作的顺畅与高效。
- 1901 年,弗朗西斯·高尔顿(Francis Galton)与他的学生卡尔·皮尔逊(Karl Pearson)一起创办了《生物统计学报》(Biometrika),首次明确提出了“生物统计”(Biometry)一词。
2001 年 9月11日迄今为止人类历史上最严重的恐怖袭击事件,导致近 3000 人死亡,时任美国总统乔治·W·布什宣布启动全球性的反恐战争(War on Terrorism),进一步促进了生物统计技术的发展与应用,从军事、国防领域延伸至民用领域。
- 2011 年发布的三星 Galaxy S2 是第一台支持人脸识别解锁的手机(虽然在此之前也有一些手机尝试过类似的功能,但三星 Galaxy S2 是较早将人脸识别解锁作为一项实用功能集成到智能手机中的设备之一)。
- 2013 年 iPhone 5s 首次引入了Touch ID技术。
- 2023 年,苹果公司发布 Apple Vision Pro,采用眼动追踪作为核心交互方式,与手势和语音相结合,使得用户在操作时可以更加灵活和多样化。
XR & AI 的信息与交互
回到信息与媒介的主题,21世纪以来,智能手机(特别是配备摄像头和 4G/5G 网络的手机)主导了内容生产(以视频为主的社交网络)和人机交互方式(触屏和语音交互),几乎覆盖了所有视频和游戏内容的消费场景。
根据《中国微短剧行业发展白皮书(2024)》,2024 年我国微短剧市场规模预计达 504.4 亿元,同比增长 35%。而国家电影局发布数据显示,2024 年中国电影总票房为 425.02 亿元。再一次印证了麦克卢汉「媒介即讯息」的正确性。
当前,AI 正在生成图像、视频乃至游戏,推动信息生产从自动化向自组织化发展。同样,眼动追踪、手势识别、语音识别和自然语言界面等越来越高自由度的多模态交互方式,代表着人机交互的未来发展方向。
- 生成式 AI 代表着信息和媒介内容自组织化生产的发展方向,虽然这些信息的消费并不一定依赖 XR(特别是头戴显示器 HMD 或近眼显示器 NED )这种交互方式;
- 而 XR 体现了人机交互和信息交互的发展方向,但它一定需要通过 AI 更深层理解人类的交互意图,使机器在与人的互动中实现更高层次的自组织化;
从这个角度来看,虚拟现实(VR)本质上是对剧场式体验的私人化和对沉浸视听感受的极致追求,很难说这一种面向未来的内容消费形式,而更像是一种技术对内容的向后兼容。
AI 与 HCI 的关系演变
关于人工智能和人机交互之间的关系,乔纳森・格鲁丁(Jonathan Grudin)在 2009 年发表了这篇《人工智能与人机交互:被共同关注点分隔的两个领域》,认为在人类社会科技发展过程中,人工智能与人机交互之间存在此消彼长、交替沉浮的关系。
这种关系的形成也不难理解,人机交互研究的本质是如何让机器(当然包括软件)更好地理解、适应人类的行为和意图,每当人工智能取得一定的进展时,自然会寄希望于机器通过人工智能达到自主化水平(也就是通用人工智能 AGI),从而一劳永逸地解决人机交互问题。
XR 2024:Apple Vision Pro,Meta AR 眼镜, Android XR
- 2024 年 2 月 2 日,Apple 的首款空间计算设备正式面向消费者市场发售;
- 2024 年 9 月 25 日,Meta Connect 2024 大会上对外公布了真 · AR Orion 眼镜;
- 2024 年 12 月 12 日,Google 推出了与三星合作开发的 Android XR 操作系统,内置了 AI 助手 Gemini,具有智能意图解析能力;
回顾 XR 2024 这一年,三大科技巨头在 XR 方向上的投入分别覆盖了人机交互(以 visionOS 为范本)、人工智能(以 Gemini 和 Llama 为先驱),目前唯一欠缺的,仍然是广泛适合于 XR 交互和消费的信息与内容。
Meta AR 眼镜的震撼发布和 Meta Ray-Ban 眼镜的商业成功在 2024 年下半年引发了"百镜大战"。这股风潮对 XR 的影响喜忧参半——大多数仓促推出的产品既不重视交互体验,也不关注内容质量,仅仅是为过剩的 AI 算力寻找一个发泄出口。
总结,进化 ≠ 取代
- XR 领域中人机交互与人工智能的"博弈"不仅涉及技术因素,更关乎人类隐私这一核心问题。就像反恐战争促使人们为安全而让渡生物特征信息一样,未来可能需要同等重大的历史事件,才能推动人们让渡更深层的隐私权。而在这场博弈中,人在与机器进行交互时的「意图」是最根本的隐私,而隐私即是主权。
- 回顾历史的意义不在于预测未来。从自动化(Automation)向自主化(Autonomization)虽然是技术发展的方向,但这并不意味着一切都会被取代。科技代表着人类追求"便利"的倾向,而人文与艺术则总是走向相反的方向。