关于人机交互的综合研究报告
张玉 刘珊珊 武明 吴丽艳 梁媛媛 张文静 (济南大学 信息科学与工程学院计0903班)
摘要 人机交互是研究人与计算机之间通过相互理解的交流与通
信,在最大程度上为人们完成信息管理,服务和处理等功能的一门技术科学。本文对人机交互中有关情感、手势和人脸识别的技术进行了概要介绍与叙述并且阐述可一些对人机交互的认知与理解。在更深入了解人机交互知识的过程中我们也可以看到人机交互技术的广阔发展前景。
关键词: 人机交互的认知 人机交互 情感 手势 人脸识别
引言
机交互(Human-Computer Interaction, 简写HCI):是指人与计算机之间使用某种对话语言,以一定的交互方式,为完成确定任务的人与计算机之间的信息交换过程。人机交互技术的发展与国民经济发展有着直接的联系,中手机的发展和多媒体电脑给社会带来的效益就可以看到.未来新一代具有自然人机交互功能的随身电脑,将成为所有 专业和普通人群生活,学习,工作的必备助手和工具,并对改变社会生活与工作的模式起到深远的影响。正是这个原因,世界各国信息领域的学者和企业巨头都部署了发展新一代人机交互领域的中长期发展计划。着人机交互技术的发展,人们越来越关注这一门科学,通过本文的综述,读者可以对人机交互技术的几个方面进行概括性了解。
1. 关于人机交互的认知
ACM图灵奖1992年获得者、微软研究院软件总工程师Butler Lampson在题为“二十一世纪的计算研究”报告中
[1]
指出“计算机有
三个作用:第一是模拟;第二是计算机可以帮助人们进行通信;第三个是互动,也就是与实际世界的交流”;“人们希望计算机能够看、听、讲,甚至比人做得更好,并能够进行实时处理”。关于对人机交互的认知,要从认知心理学开始说起,认知心理学研究的是人们如何获得外部世界信息,信息在人脑内如何表示并转化为知识,而知识是怎样存储的又如何用来指导人们的注意和行。认知心理学涉及心理活动的全部过程——从感觉到知觉、识别、注意、学习、记忆、概念的形成、思维、表象、回忆、语言、情绪和发展过程。认知有很多个过程,包括感知、关注、记忆、学习、识别、 阅读、说话和聆听、规划、推理和决策等。
感知和认知:人的感知是通过人体器官和组织进行人与外部世界的信息的交流和传递;而认知是人们在进行日常活动时发生于头脑中的事情,它涉及思维、记忆、学习、幻想、决策、看、读、写和交谈等。感知和认知又是密切关系不可分开独立存在的,人的感知是认知的基础,认知是将感知获取的信息综合运用。
认知过程与交互原则:许多认知过程是相互依赖的,一个活动可同时涉及多个不同的过程,只涉及一个过程的情况非常罕见,例如人们在选购商品时就涉及关注、感知、识别、说话、思考、决策等过程。 由人的关注特点,在设计人机交互界面时应做到。信息的显示应醒目,以便执行任务时使用,可使用动画图形、彩色、下划线,对条目及不
同的信息进行排序,在条目之间使用间隔符等。避免在界面上安排过多的信息。尤其要谨慎使用色彩、声音和图像,人们倾向于使用过多的这类表示,而导致界面混杂,分散用户的注意力,让用户反感。
朴实的界面更容易使用。 在人机交互的发展中,一大批专家为此
做出了卓越的贡献.:(1)1945年,美国罗斯福总统的科学顾问Bush (1894~1974)在《大西洋月刊》上发表的“a5 we maythink”的著名论文
[2]
,提出了虚采用设备或技术米帮助科学家检索、记录、分析
及传输各种信息的新思路和名为“Memex”的一种工作站构想,影响着一大批最著名计算机科学家.
2. 关于情感
情感在人类的认识和人机交互中起着关键性的作用.具有情感能力的计算机就是让计算机能够在和人类相处时更有智能、更为敏感和更为和谐和亲切。随着计算和通信技术的广泛应用, 人机和谐技术将会以多种方式出现。举例来说, 它就可以通过理解你所说的话语、你的面部表情、你的手势甚至你走路的姿态, 知道你想要做的事情。如果技术再先进一点,计算机还能够意识到你所处的情境, 譬如你在打电话, 它就会自动调低电视机音量。此外, 它还能够对你进行识别, 记住你所喜欢的频道和你想录制的节目。
[3]
情感是一种内部的主观体验,但总是伴随着某种外部表
情。面部表情不仅是人们常用的较自然的表现情感的方式,也是人们鉴别情感的主要外部标志。例如,愉快时额眉平展、面颊上提、嘴角上翘,而悲伤时额眉紧锁、嘴角下拉。使用特定的仪器可以对面部的
微小表情变化进行研究,甚至可以区分真笑和假笑。
情感计算机是能够听、看和随时感知使用者需要的计算系统。 情感计算(Affective Computting)就是要赋予计算机类似于人一样的观察、理解和生成各种情感特征的能力,最终使计算机像人一样能进行自然、亲切和生动的交互。
基本情感,比如喜悦、愤怒、忧伤、惊奇、厌恶、不紧张、紧张 语音情感识别:语音情感分析是情感识别的一种方式。 其它情感识别手段: .面部情感识别 .肢体情感识别 .生理情感识别
语音输入参考模板/模型 判决 预处理 特征提取 模式/模型匹识别结果语音情感识别系统结构
语音情感识别过程:对语音信号根据需要进行预处理, 1. 提取跟情感相关特征信息, 2. 根据这些特征进行分类, 3. 最后得出识别结果
语音情感特征:国际上对情感语音的研究主要侧重于情感的声学特征的分析这一方面。
一般来说,语音中的情感特征往往通过语音韵律的变化表现出来。例如,当一个人发怒的时候,讲话的速率会变快,音量会变大,音调会变高等,同时一些音素特征(共振峰、声道截面函数等)也能反映情感的变化。中国在人机交互语音方面的研究也已经有一些很好的研究成果并已经应用于实际市场之中
[4]
。1999年,在国家智能计算机研
究开发中心、中国科技大学人机语音通信实验室的基础上组建了科大讯飞公司,技术上更着眼于合成语音的自然度、可懂度和音质,设计了基于L/VIA声道模型的语音合成器、基于数字串的韵律规则分层构造、基于听感量化的语音库,以及基于汉字音、形、义相结合的音韵码等,先后研制成功音色和自然度更高的KD863及KD2000中文语音合成系统.其语音产品在主流市场有较高占有率,并牵头制定中文语音标准,是具有国际先进水平的汉语语音合成技术\.语音情感特征参数。
研究发现,基音是语音情感识别中最重要的特征,其次是语音的能量,然后才是发音持续时间、发音速率等其它声学参数。 汉语情感语音中特征参数变化情况 T F0 F0 F0 A A range + + ++ + + + + F1 F1 F1 range rate 喜 怒 + - + + + + + + + range rate + + - -
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库关于人机交互技术的综合研究报告在线全文阅读。
相关推荐: