将ChatGPT集成到Siri中,让你的苹果语音助手更智能100倍

我们都有过这样的经历:你问Siri一个问题,它的回答总是令人沮丧:“对不起,我不明白。”这可能是口音或方言的问题,也可能是Siri没有接受谷歌的人工智能所训练的大量数据的训练,或者只是苹果完全把Siri搞砸了。苹果在近13年前就以应用程序的形式推出了语音人工智能,尽管Siri在10多年后的今天仍然给人明显的愚蠢和无用之感。谷歌的语音人工智能似乎是当今最受欢迎的选择,尽管有一个新的孩子绝对是在吃谷歌的午餐,至少在搜索部门。

OpenAI的ChatGPT在不到一年前发布,以其令人难以置信的自然语言处理能力席卷全球,在短短5天内就突破了100万用户,在短短两个月内就突破了1亿用户(这比Facebook、谷歌甚至Snapchat等社交媒体巨头的增长速度还要快)。ChatGPT的智能和类似人类的回答使其成为完美的人工智能聊天机器人,特别是考虑到它确实比大多数其他人工智能工具更能理解自然句子,而且它最有可能回答一个有用的答案而不是道歉。开发者Mate Marschalko认为这是一个绝佳的机会,可以将ChatGPT的智能与Siri整合在一起,将其变成一个更有用的语音AI。Marschalko使用苹果的快捷键功能将Siri的语音功能与ChatGPT的NLP智能结合起来,只花了他一个小时左右的时间。结果呢?一个更好的语音AI,可以获得更好的搜索结果,提供更有意义的对话,甚至让你以一种更“人性化”的方式控制你的智能家居,在可用性方面几乎可以与托尼·斯塔克的JARVIS相媲美。最棒的是什么?你也可以做到!

Marschalko列出了他的整个过程中型博客文章如果你也想用一种完全不需要编码经验的方法来构建自己的“SiriGPT”,我强烈建议你去看看。他说:“我让GPT-3假装是我家的智能大脑,仔细解释它可以在房子周围访问什么,以及如何回应我的请求。”“我用简单的英语解释了这一切,没有涉及程序代码。”

上面的视频演示了Marschalko的“SiriGPT”是如何工作的。他的家里装满了几十盏灯、恒温器、地暖、通风设备、摄像头等等,使它成为可能每种用例的完美测试场地。Marschalko首先将他的任务分成四种不同的请求类型。这四种请求类型分别被标记为命令、查询、回答和澄清,每一种请求类型都有自己的流程,GPT-3遵循这些流程来确定需要做什么。

Marschalko的人工智能在处理间接措辞的命令方面明显更好。

神奇之处在于,即使是来自Marschalko的间接请求,助手也能理解并将其转化为有意义的行动。虽然Siri和其他人工智能助手只对“开灯”或“打开车库门”等直接请求做出回应,但GPT3允许进行更微妙的对话。在一个例子中,Marschalko说:“请注意,我是在办公室的黑暗中录制这个视频的。你能做点什么吗?”助手会立即打开灯,同时回复人工智能生成的回复,而不是模板回复。在另一个例子中,他说:“我妻子正在开车回家的路上,15分钟后就会到。在她停车前为她打开外面的灯”,服务员回答说:“在你的客人到达之前,灯应该打开!”,展示了两件强大的事情:一是掌握像“想要在延迟几分钟后打开特定的灯”这样复杂概念的能力,二是以自然的方式做出回应,传达出他们完全理解你想要做的事情。

马沙尔科将所有这些连接到一个名为“Okay Smart Home”的快捷方式上,要启动它,他所要做的就是激活Siri,说出快捷方式的名称(在这种情况下是“Okay Smart Home”),然后开始与他的助手交谈。这四种请求类型基本上允许Marschalko覆盖所有类型的场景,从使用命令请求控制智能家电到使用查询请求询问家电的状态(如房间或烤箱的温度)。回答请求涵盖了更多以聊天为中心的查询,比如向人工智能询问建议、建议或来自整个网络的一般信息,而最后的澄清请求将允许人工智能在无法检测到前面三种请求类型中的任何一种时,要求你重复或重新表达你的问题。

虽然这款gpt驱动的助手绝对比明显更笨的Siri要好,但它并不是免费的。你必须建立一个OpenAI账户,并购买代币来访问它的API。Marschalko说:“使用API每个请求的成本约为0.014美元,所以你可以用1美元执行70多个请求。”“请记住,这被认为是昂贵的,因为我们的请求很长,所以对较短的请求,你会按比例支付更少的费用。”

整个过程都列在这里中型博客文章如果你想学习如何构建自己的助手与其独特的功能。如果你有一个OpenAI账户,想要使用Marschalko在上面的视频中构建的AI好的智能家居快捷方式,可与您自己的API密钥一起下载和使用。