拥有感情,表达情绪的AI
日期:2024-05-17 作者:小天
来源:www.txunda.com
人气:675
或许是因为它很新颖,或许是因为它很普通,但在目前的市场上,很多人都喜欢拥有人类情感的人工智能。
不管是去年十二月新浪微博发布的“奇怪的,已阅读的,杂乱的回复”的留言机器人“评论罗伯特”。还是 Inflection AI的“Pi”,一款睿智的智能聊天机器人,因为它的性格时而猥琐,时而温暖,在社交平台上火了一把。
但要说到情感的捕捉和表达,那就是声音了,即使只是极小的声调变化,或短促的声调,也足以引人遐思。
就在前不久, Hume AI发布了具有情感辨识功能的共情语音接口(EVI),正如 Suno颠覆了音乐创作方式、 Sora重构了影视创作过程, EVI整合了大语种模型(LLMs)和表达度量完备集(eLLM),这一概念颠覆了以往对生成型人工智能的刻板印象。
一、人工智能不仅了解你所说的,而且还了解你的想法
经过长期的训练,人工智能可以对人类的输入进行反馈,一旦有了线索,就会自动预测出下一个词或者字符,从而产生相应的文字。
这并不能算是 AI能听懂它的意思,更多的人会觉得它就像是在跟人玩文字游戏,并不清楚自己所说的话到底是什么意思,这也说明了 AI对所输入的语境的理解也有一定的限制,要想理解人类沟通中微妙的语言,讽刺,歧义等复杂的信息,依然是一个挑战。
那么,如果给人工智能添加一个情感输入界面,人工智能会不会也能够了解人类的情感?
在人工智能方面,纽约一家名叫 HumeAI的创业公司,正致力于这项开创性的研究。这家公司的创始人是谷歌深空局的前研究员艾伦·考恩,它的任务就是引进一种名为“同情之声界面”的高级语音人工智能,从而实现人与人之间的交流。
EVI是人类历史上最早拥有“情商”的 AI,它是人类智慧的结晶。等我们真正体验了一下,确实能感觉到人工智能的人性化。
EVI的使用非常简单,只要让网站有权使用手机话筒,你就能和这个“聊天机器人”自由交谈。
当你兴奋地和 EVI打个招呼的时候,她也会以同样兴奋的情绪的方式回应你。
在这次的体验中,我发现了不少的亮点。一是声音辨识精准、清楚,即使在微弱的噪声干扰下, EVI仍能正确地将句子中的连贯句子转换成词语及提取语音情感的条形图。
根据 HomiAI官方网站显示的资料, EVI可以辨识53种不同的情感并作出反应。这种通过语音识别情感的能力来自于世界各地几十万人的可控实验,而 EVI则是建立在对不同文化背景下的语音、面部表情进行复杂分析的基础上。
HumeAI通过对海量情感数据进行训练,构建了一种人工智能模型,能够很好地理解并传递情绪的微妙差异,大大超越了现有人工智能技术的极限。
此外, Hume AI还将一项被广泛用于心智语言统计分析的技术——“语义空间”(Semantic Space Theory, SST)引入到 EVI的研究中。基于海量数据采集与高级统计学建模, SST能够准确描绘出人的情绪图谱,并挖掘人的情绪状态间的连续关系,赋予 EVI更多拟人特征功能。
拥有“情商”的 EVI对人类情绪的了解与反应将是人工智能科技的一个重要跨越。
由于 EVI能够了解并对人的情绪做出反应,因此 EVI是一项重要的进步。相比于传统的语音助手,单纯依靠语言指令,冰冷地输出正确答案, EVI可以识别人的声音,并做出相应的反应。
二、语音辅助系统的演进
HumeAI现在只有在它的官方网站上才能使用,但是可以预料,拥有声音情感识别功能的聊天机器人,将会成为一款智能硬件,变成一款贴心的智能助手。
在硬件上安装了语音助手之后,它已经变成了一个智能时代的一个重要工具,它使我们和手机之间的互动方式发生了革命性的变化。从饱受争议的 Siri到人工智能的私人助理,声音助手的进化速度是惊人的。
声音辅助工具的研发要回溯到上个世纪五十年代,例如 IBM公司的 Shoebox公司以及贝尔实验室的 Audrey公司,它们都只能够识别少数几个字或词组。
到了九十年代,随着计算机技术的进步,网络的普及,各种声音识别技术也随之发展起来,其中 Dragon NaturallySpeaking以及早期的“声控”虚拟助理等都以其强大的声音识别与转录功能而走在了世界的前列。
后来,像 Siri这样的具有会话功能的语音助手,随着智能手机的出现,苹果 Siri,谷歌现在,微软的 Cortana,亚马逊的 Alexa,都成为了划时代的产品。
当前,以 OpenAI、 HumeAI等技术企业通过增强对语音人工智能的理解能力,为其创造了更人性化、更自然的互动方式,在 AI的支持下,“真正的语音助手”应运而生。
不管是去年十二月新浪微博发布的“奇怪的,已阅读的,杂乱的回复”的留言机器人“评论罗伯特”。还是 Inflection AI的“Pi”,一款睿智的智能聊天机器人,因为它的性格时而猥琐,时而温暖,在社交平台上火了一把。
但要说到情感的捕捉和表达,那就是声音了,即使只是极小的声调变化,或短促的声调,也足以引人遐思。
就在前不久, Hume AI发布了具有情感辨识功能的共情语音接口(EVI),正如 Suno颠覆了音乐创作方式、 Sora重构了影视创作过程, EVI整合了大语种模型(LLMs)和表达度量完备集(eLLM),这一概念颠覆了以往对生成型人工智能的刻板印象。
一、人工智能不仅了解你所说的,而且还了解你的想法
经过长期的训练,人工智能可以对人类的输入进行反馈,一旦有了线索,就会自动预测出下一个词或者字符,从而产生相应的文字。
这并不能算是 AI能听懂它的意思,更多的人会觉得它就像是在跟人玩文字游戏,并不清楚自己所说的话到底是什么意思,这也说明了 AI对所输入的语境的理解也有一定的限制,要想理解人类沟通中微妙的语言,讽刺,歧义等复杂的信息,依然是一个挑战。
那么,如果给人工智能添加一个情感输入界面,人工智能会不会也能够了解人类的情感?
在人工智能方面,纽约一家名叫 HumeAI的创业公司,正致力于这项开创性的研究。这家公司的创始人是谷歌深空局的前研究员艾伦·考恩,它的任务就是引进一种名为“同情之声界面”的高级语音人工智能,从而实现人与人之间的交流。
EVI是人类历史上最早拥有“情商”的 AI,它是人类智慧的结晶。等我们真正体验了一下,确实能感觉到人工智能的人性化。
EVI的使用非常简单,只要让网站有权使用手机话筒,你就能和这个“聊天机器人”自由交谈。
当你兴奋地和 EVI打个招呼的时候,她也会以同样兴奋的情绪的方式回应你。
在这次的体验中,我发现了不少的亮点。一是声音辨识精准、清楚,即使在微弱的噪声干扰下, EVI仍能正确地将句子中的连贯句子转换成词语及提取语音情感的条形图。
根据 HomiAI官方网站显示的资料, EVI可以辨识53种不同的情感并作出反应。这种通过语音识别情感的能力来自于世界各地几十万人的可控实验,而 EVI则是建立在对不同文化背景下的语音、面部表情进行复杂分析的基础上。
如果您需要相关服务,可以找天津天迅达科技有限公司,我们的业务有Web开发、iOS APP、Android APP、微信开发、HTML5开发等,天迅达——您身边的App个性化定制专家!
据 HumiAI介绍, EVI的情感感知主要得益于共情大语种(eLLM),它可以通过语境、情感表达等方式对词汇、语调进行调节。HumeAI通过对海量情感数据进行训练,构建了一种人工智能模型,能够很好地理解并传递情绪的微妙差异,大大超越了现有人工智能技术的极限。
此外, Hume AI还将一项被广泛用于心智语言统计分析的技术——“语义空间”(Semantic Space Theory, SST)引入到 EVI的研究中。基于海量数据采集与高级统计学建模, SST能够准确描绘出人的情绪图谱,并挖掘人的情绪状态间的连续关系,赋予 EVI更多拟人特征功能。
拥有“情商”的 EVI对人类情绪的了解与反应将是人工智能科技的一个重要跨越。
由于 EVI能够了解并对人的情绪做出反应,因此 EVI是一项重要的进步。相比于传统的语音助手,单纯依靠语言指令,冰冷地输出正确答案, EVI可以识别人的声音,并做出相应的反应。
二、语音辅助系统的演进
HumeAI现在只有在它的官方网站上才能使用,但是可以预料,拥有声音情感识别功能的聊天机器人,将会成为一款智能硬件,变成一款贴心的智能助手。
在硬件上安装了语音助手之后,它已经变成了一个智能时代的一个重要工具,它使我们和手机之间的互动方式发生了革命性的变化。从饱受争议的 Siri到人工智能的私人助理,声音助手的进化速度是惊人的。
声音辅助工具的研发要回溯到上个世纪五十年代,例如 IBM公司的 Shoebox公司以及贝尔实验室的 Audrey公司,它们都只能够识别少数几个字或词组。
到了九十年代,随着计算机技术的进步,网络的普及,各种声音识别技术也随之发展起来,其中 Dragon NaturallySpeaking以及早期的“声控”虚拟助理等都以其强大的声音识别与转录功能而走在了世界的前列。
后来,像 Siri这样的具有会话功能的语音助手,随着智能手机的出现,苹果 Siri,谷歌现在,微软的 Cortana,亚马逊的 Alexa,都成为了划时代的产品。
当前,以 OpenAI、 HumeAI等技术企业通过增强对语音人工智能的理解能力,为其创造了更人性化、更自然的互动方式,在 AI的支持下,“真正的语音助手”应运而生。
以上所有设计图和部分文字均来自网络,如有侵权,请call我删除,感谢~
天津天迅达科技有限公司经过多年来对APP、小程序、以及网站建设的探索,已经帮助每一个客户快速开发出属于自己的APP、小程序、网站,是万千企业之选。
相关资讯
- 数字孪生:现实世界的身外化身 2024-12-06
- 微信公众号全面“今日头条化”,自媒体将迎来“第二春”? 2024-12-04
- 优质长视频的破圈效应 2024-12-05
- 奶茶行业的裂变营销 2024-12-03
- 浅浅分享下支付产品经理如何写全局性的需求文档以及工作流程 2024-12-02
- “麦学”爆红:一场精心策划的营销盛宴 2024-11-29
- 如果遇到麦琳式的领导,怎么办? 2024-11-28