领先的OpenAI正在减速

日期:2024-05-14  作者:小天  来源:www.txunda.com  人气:507

        “如果是GPT-5的话, OpenAI还是会远远领先于我们。如果它是‘AI Search’、‘语音助手’之类的,那么‘开放 AI’的衰落也就从此开始了。”
一名 AI大型建模从业者对小编表示,业界对于开放 AI的期望过高,如果不做出像GPT-5那样颠覆性的革新,恐怕难以满足受众的“胃口”。
虽然在 OpenAI的直播之前,Sam Altman就说过,不会推出GPT-5 (GPT-4.5),但对于 OpenAI的前景,外界却是充满了期待。
北京时间五月十四日早上, OpenAI发布了其最新版本GPT-4o, o意为全能模型(Omnimodel)。长达20分钟的视频演示,将目前市面上任何一款语音助手都无法比拟的人工智能互动体验,与国外媒体爆料的内容基本一致。
        尽管GPT-4o展示出来的效果依然可以用“炸裂”来形容,但是业界却认为,这与 Altman在预告中所说的“魔法”一词并不相符。许多人将其视为“偏离 OpenAI使命”的工具。
OpenAI的PR小组似乎已经预见到了这样的公众意见。在发布会之后, Altman在自己的博客上作出了这样的说明:
“我们的任务很重要的一环,就是让那些功能强大的人工智能工具能够免费(或者以折扣价)为大家所用。我很骄傲的是,我们把全球最好的模型都放在 ChatGPT上,而且不带任何广告。在我们创建 OpenAI的时候,我们的初衷就是要创建人工智能,并通过它为全世界带来各种各样的好处。取而代之的是,目前看来,我们要制造出人工智能,而别人则会利用人工智能来制造各种各样的神奇东西,造福于我们。”

天津天迅达科技有限公司

如果您需要相关服务,可以找天津天迅达科技有限公司,我们的业务有Web开发、iOS APPAndroid APP、微信开发、HTML5开发等,天迅达——您身边的App个性化定制专家!

        GPT-4o基本上可以很好地解决系统的时延问题。GPT-4o对声音的应答最短时间是232ms,平均时间是320ms。未用GPT-4o的ChatGPT语言会话功能,其平均延迟为GPT3.5为2.8s,GPT-4为5.4s。
GPT-4o不但大大提高了用户体验,同时大大减少了延时,它还对GPT-4进行了大量的更新,其中包括:
出色的多模式互动功能,包括声音,视频和屏幕分享。
它能对人的面部表情、语言、数学公式进行实时的辨识与理解。
互动语音的情感是非常丰富的,它能改变语音的语调,风格,还能模拟、“即兴”演唱。
延迟极小,可以在聊天的过程中中断人工智能,添加更多的信息或者打开新的话题。
        所有 ChatGPT的用户都是免费的(有使用限制)。
比GPT-4Turbo快一倍, API开销降低了一半,而码率上限提高了5倍。
一些行业专家表示,GPT-4o的多种模式功能仅仅是“看起来”不错而已,而事实上, OpenAI还没有展现出在多模式可视化方面的真正“突破”。
尽管该模式可以添加语调,甚至可以进行即兴的歌唱,但是它的内容仍然不够细致,也不够有创意。
另外,在发布会之后, OpenAI的官方网站上也公布了关于GPT-4o的一些应用实例。包含:相片转换为卡通样式、会议纪要、图片合成;以图像为基础的三维内容生成;手写体,草稿生成;有样式的海报,漫画的产生,美术字型的产生,等等。
        而这些能力中,比如图片转漫画、会议纪要之类的,都是很常见的插画、 AI建模之类的。

以上所有设计图和部分文字均来自网络,如有侵权,请call我删除,感谢~

天津天迅达科技有限公司经过多年来对APP小程序、以及网站建设的探索,已经帮助每一个客户快速开发出属于自己的APP小程序网站,是万千企业之选。

标签:天迅达科技 天津APP开发 天津网站建设 网站建设