We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

AI for Everyone: How Gooey.AI Empowers Global Frontline Workers with Low Code Workflows - Episode 244

2025/2/3

The AI Podcast

Sean Blagsvedt: GUI.AI 起源于一个由英国文化协会资助的数字艺术项目,旨在创建一个AI角色,匹配来自英国和印度的创作者、活动家和设计师。我们赢得了奖项并构建了一个原型,效果很好。后来,我们获得了TechStars的种子基金,并将这个AI角色的想法发展成一个名为Dara.network的通信应用程序,服务于文化和社会影响组织,帮助他们管理校友并保持联系。我们最初的AI角色Dara,目标是让非技术人员也能创建自己的AI角色。在COVID期间,我们邀请了来自英国、美国、印度和斯里兰卡的23位人士,每周见面,开发了一个底层架构,使他们能够构建一个图灵测试视频盒。我们很早就获得了GPT API的访问权限,并将视频消息与语音识别和长篇剧本结合起来,创造出能够通过图灵测试的角色,我们称之为Rad Bots。这些Rad Bots代表了作家们认为未被充分代表的社区的声音,旨在减少算法偏见。这个项目展示了我们构建底层架构和编排平台的能力,使我们能够即插即用地使用新兴的AI技术。这促使我们思考如何将这个平台开放给更广泛的世界,实现人工智能的民主化,让更多人能够参与其中,即使他们不懂编码。 Archana Prasad: 我认为GUI.AI的核心在于让每个人都能参与到AI的开发和使用中来,即使他们没有编码背景。我的背景是艺术和设计,但我很幸运能在微软研究院工作,接触到世界上最聪明的人和最新的研究成果。我们一直在研究如何构建能够触达所有人的界面,包括那些不擅长英语读写的人。事实上,印度在这方面走在前列,直接跳过了电子邮件,进入了基于短信和WhatsApp的界面。因此,我们一直在探索如何构建基于AI的交互式工具,让每个人都能使用。GUI.AI的名称也体现了这一点,它既是对图形用户界面的致敬,也是对连接组织的隐喻。我们希望创建一个平台,让人们能够轻松地尝试各种AI技术和工具,而无需单独订阅它们。我们相信,通过允许有创造力的人以新颖的方式组合这些技术,我们可以创造出更大的价值。GUI.AI的目标是抽象化底层技术,使每个组件都可以热插拔和评估,让用户能够轻松地比较不同的模型和服务,并选择最适合自己需求的。

Deep Dive

Shownotes Transcript

Gooey.AI 的联合创始人 Sean Blagsvedt 和 Archana Prasad 讨论了他们的平台如何使 AI 在各个社区中更容易获得。该平台使团队能够利用多种 AI 工具,从而提高农业、医疗保健和一线服务等领域的生产力。关键应用包括支持非洲农民通过 WhatsApp 使用的多语言聊天机器人,以及帮助 HVAC 技术人员访问技术文档的 AI 助手。</context> <raw_text>0 您好,欢迎收听 NVIDIA AI Podcast。我是主持人 Noah Kravitz。我们今天的嘉宾最近因其在创建 Ulungizi 方面的工作而登上 NVIDIA 博客,

这是一个通过 WhatsApp 向非洲农民提供多语言支持的 AI 聊天机器人。然而,尽管该项目至关重要,但 GUI AI 远不止一个简单的聊天机器人。GUI AI 是一个用于开发基于私有和开源 AI 模型的低代码工作流程的平台。GUI 将易用性与创新的功能(如黄金问答)相结合,使开发人员能够快速编码并改变世界。

今天来讲述 GUI 故事的是公司的创始人兼首席执行官 Sean Blagsvet 和创始人兼首席创意官 Archana Prasad。欢迎两位,非常感谢你们加入 NVIDIA AI Podcast。你好。

你好。嗨。谢谢,诺亚。我非常期待你们谈论 GUI 平台,它的起源,它可以做的所有事情,包括你们如何帮助开发人员对抗 AI 幻觉,这是当今的一个热门话题。但我希望你们能从头开始,告诉我们 GUI AI 是什么以及你们是如何起步的。

我来试试吧。我们实际上是从一个多年前(我想说是 2018 年或 2019 年)由英国文化协会资助的数字艺术项目开始的,我们申请创建一个 AI 角色来为来自英国和印度各地的创作者、活动家和设计师牵线搭桥。我们获得了该奖项。我们构建了一个原型。我们对其进行了测试。它运行得非常好。

而且,长话短说,我们成功地从 TechStars 获得了种子基金,对吧?是的。是的。我们进入了 TechStars,这是一个非常棒的项目。我们采用了 AI 角色的想法,并围绕它构建了一个完整的通信应用程序,称为 Dara.network,旨在为文化组织和社会影响组织提供服务,使他们能够轻松地管理校友并保持联系。我们构建的第一个 AI 角色,也令人困惑地称为 Dara,是......

我感到孤独,想要一些朋友。我们想,邀请非技术人员、作家、剧作家、作者、诗人来创作他们自己的 AI 角色岂不是很好?而这正值 COVID 期间。所以所有这些......

他们失业了。对。他们被隔离了。被隔离了。是的。是的。是的。是的。因此,我们邀请了来自英国、美国、印度、斯里兰卡等地的 23 位人士,并定期见面,几乎每周一次。是的。

最终开发出一种底层架构,使他们能够构建所谓的......图灵测试视频框,对吧?因此,我们的联合创始人 Dave 与 OpenAI 的总裁 Brockman(我想是......)在 Discord 论坛上闲逛,直到我认为......Chris Brockman,是的,是的。是的,那是大约五年前的事了。然后我们有了......

非常早期的 GPT API 访问权限。我们已经将 Dara 构建为一个异步视频消息传递平台,有点像,你知道,Discord 加上 LinkedIn,里面还带有一点 Mark Polo。所以想法是,好吧,如果我们采用,你知道,这是一个疯狂的想法。比如,如果我们采用人们发送的视频消息,将其与谷歌的语音识别连接起来,将其馈送到长篇脚本中,

脚本,对吧?这些剧作家和作者正在一起编写。然后,你知道,我们有这样的想法:如果每次 API 调用 1.5 美元到 2 美元,我们可以得到什么?对。然后,我们基本上有了他们正在创作和一起编写的脚本。

然后我们有了,你知道,deepfakes API 才刚刚开始出现,并且有文本转语音。所以我们想,好吧,我们可以把机器人说的话拿回来,对,DaVinci 的输出,然后把这段文字放到文本转语音引擎中,放到唇形同步片段中,然后砰的一声,你就得到了这些通过图灵测试的角色。我们称它们为 rad 机器人。那些就是 rad 机器人。

它们很棒。它们现在仍然很酷。是的,它们很疯狂。就像我们有一件小事。这是一个公开的家庭播客,但是,你知道,我们有,你知道,rad 机器人说。那是 1921 年大型语言模型的狂野西部时代。是的。是的。这些机器人真的说了他们的想法。是的。它们代表了作家认为没有得到充分代表的问题。它们没有。

代表了那些代表性不足的社区。

为了减少该小组非常强烈地感受到的算法偏差。你知道,你参与其中,机器人完成了,它们愉快地聊天,人们很兴奋。就像小孩子跟它们聊过一千次一样,比如一个孩子,1200 次,对吧?这些作品在印度艺术博览会、英国文化协会主办的活动 Be Fantastic、印度文学节上展出。我

它们大受欢迎。它们大受欢迎。是的。是的。相当多。关键是我们已经构建了这种底层架构和编排平台,它使我们能够插入和播放所有新兴的 AI 新技术。而那......

我认为,就在这个房间里,约翰和我意识到,好吧,我们有消息传递平台,但我们还能做什么?这几乎是 GUI 的开始。我们觉得,嘿,如果我们可以带着艺术家和作家一起踏上旅程,为什么不将其扩展到更广阔的世界,并真正实现我们当时已经开始深深感受到的使命,即使 AI 民主化。

并真正让人们能够使用它,即使他们不知道如何编码。我不是程序员。所以,你知道,我理解这一点。我想快速问一下你们的背景。我想知道技术方面,以及冒着俗气的风险。除了让每个人,艺术家、创意人员、非程序员都能使用这些技术之外,除了这是一件很棒的事情之外。为什么那是你们的重点?哦,你为什么要做这样的事情?是的。

我的背景实际上是艺术和设计。我以前学习过绘画和动画电影设计,并且非常幸运地遇到了 Sean。他来到印度建立微软研究院。这是 2005 年之前的事。所以我排第三,她排第五。在这个令人惊叹的组织中。我们将找到第四名,让他们来参加播客。是的,没错。是的。

是的,这就是我们相遇的方式。我没有编程背景,但我确实在微软研究院闲逛,接触到世界上一些最聪明的人才以及从那里出来的论文。而且我们是,我认为是第一个,也许也是唯一一个原型。这是什么?高级原型设计。我的职位是产品管理和高级原型设计主管。所以我们做了很多工作。你知道,这就像 2004 年到 2010 年,对吧?

围绕着我们如何构建能够触及每个人的界面?我们如何为那些识字率有问题的人构建界面?我拥有 2005 年机器翻译和即时消息的专利。这是我们长期以来一直在研究的领域,在 NVIDIA 硬件上运行大型模型,试图了解每个人通过渠道界面所说的话。

坦率地说,印度领先一步。它跳过了电子邮件,对吧?每个人都直接进入了基于短信的界面,在接下来的几年里进入了 WhatsApp。所以我想说,在如何构建适用于每个人的工具和基于 AI 的交互式界面(包括那些不太擅长阅读或书写英语的人)方面,我们已经在这个领域进行了长达 20 年的实验。

之后,Archana 离开了......建立了一个名为 JAGA 的组织,然后又建立了一个名为 Be Fantastic 的组织,与联合创始人 Freeman 和 Kamiya 合作。其理念是,我们如何将艺术家和创意实践与技术实践结合起来?我们如何将来自这些不同领域的从业者聚集在一起,并使他们能够进行对话并服务于当时的一些紧迫问题?所以......

很快,很多活动家等等都开始了。我们于 2009 年与 Freeman 一起启动了 Jaga,Be Fantastic 作为公共艺术节启动,关注艺术和技术,特别是针对气候变化和联合国可持续发展目标等问题。与此同时,我正在经营一家名为 BabaJob 的公司,这是印度最大的面向非正规部门的招聘网站。所以我们如何利用电话和 IVR 等技术来帮助司机、厨师和女佣

这是一个短信和多语言界面,基本上将他们与更好的工作联系起来。非常深入的电话界面。是的,她是声音。但是,你知道,我们每天要接 50,000 个电话。我们的电话费非常高昂。我们有 900 万用户。我们每月处理 100 万份申请。这是一个大型项目。那是我的 11 年人生,而她当时正在经营 Jogged Apparel。在那段时间里,我们到达了那里。

是的。所以你们有资格,你们有能力。我认为在我打断你之前,Archana,你正要说,所以我们最终得到了这个我们称之为 GUI 的平台。是的,我们做到了。我喜欢这个名字。它有点像图形用户界面。在 GUI 还是一件事情的旧时代。也是连接组织。而现在的 GUI,你

是的,所以我们几乎在一夜之间,从字面上来说,进行了转型。我们将我们的团队带到了这个想法。他们也很喜欢它。很快我们就有了 GUI,它几乎就是今天的模样。好吧,然后,你知道,它建立在一个几乎一开始就作为笑话的前提上,但每天都感觉越来越不像笑话了,那就是我们所有人都会成为 AI 提示词编写者和 API 拼接者,对吧?就未来的工作而言,每个人似乎都会做那件事。

然后,你知道,这个想法是,好吧,如果那是世界,你需要什么?就像,那将是什么的 JS 或 JS fiddle 等价物?就像,当我制作一些东西时,你如何查看该东西的源代码并理解我在做什么,以便我可以通过构建你所做的事情来学习?对。有点像,你知道,从,你知道。是的。研究世界的引文和公开论文,这可以追溯到启蒙运动的开端。

以及开源运动。我们想说,对于这些新的更高级别的抽象来说,这意味着什么,嘿,你有一些大型语言模型提示,你想连接到这里,另一个 API,你想连接到一些其他通信平台。你如何提取它?

以便让新一代和非程序员能够玩耍。而且效率也很高,对吧?是的。我的意思是,其理念是一个一站式场所,对吧?你可以尝试各种不同的 AI 技术和工具,而无需单独订阅任何一个。是的,是的。这是因为这部分,我们看到了来自许多部门的大量创新。

开源生态系统显然每天都在创造令人难以置信的新模型,不仅围绕大型语言模型,还围绕动画、图像创建和文本转语音。而且我们通过与 Radbots 的合作看到了,当你允许有创造力和能力的人

以新颖的方式将它们组合在一起时,你会得到这种神奇的效果。这就是你获得神奇效果的地方。数千次互动,这绝对大于其各部分的总和。是的。因此,我们非常具体地想说,很好,当 OpenAI 或 Google 或开源社区推出一些新功能时,我们应该不断地让生态系统变得更好。

所以我们整个想法是,我们应该在顶部进行抽象,以便每个组件本质上都是可热插拔和可评估的,这就是你的黄金问题出现的地方。是的。但是你基本上可以说,嘿,OpenAI 对于,或者,你知道,一些,哦,一个部件出来了。它对我来说更好、更便宜、更快吗?然后,你知道,鉴于我们对未来影响的看法,比如,每个部件的碳使用量是多少?好的。

我们如何向那些购买和使用这些 API 的人以及你将要组合在一起的任何链或工作流程的第四个重要因素说明这一点?

很多问题。也许我会问你,对于纯音频格式来说,这是一个糟糕的问题,但是我们会这样做。这就是我们在这里所做的。所以我们会这样做。一个新用户来到 GUI。是的。也许是那些,你知道,理解大型语言模型是什么,技术如何工作的人。他们知道 API 是什么。也许他们复制粘贴过一两次代码,你知道。

他们如何开始?是拖放吗?是将内容写入,你知道,某种聊天机器人纯文本界面吗?该平台对用户来说是如何工作的?总的来说,你知道,这是我们从

Baba job 学到的东西,我们在 SEO 方面做得很好。我们擅长 SEO 的原因是,我们试图降低摩擦。因此,当你进入时,如果你在 Google 上搜索 AI 文档搜索或,你知道,农业机器人或 AI 动画,你可以进入那里,你可以直接看到提示和输出。你可以进入示例。你可以看到我们希望越来越好并且与你的领域相关的许多其他示例,这是一种 UGC 模型。每一个,你都可以说,很好,我喜欢它。我要调整它。

对。所以你抓取一个预先存在的。是的。我要更改此模型是什么。我要。所以我们总是有这种......我们绝对受到 replicate 的启发。对。这绝对是,你知道,这种想法,比如其他人使用了什么输入,输出是什么?但要以一种将这些不同的组件链接在一起的方式来做到这一点,以便看到一些很棒的东西。

就是这样。它是一种拖放式和更多下拉菜单。是的。因为那里的理念是透明度。对于许多其他网站,我认为它们隐藏了实际上正在产生神奇效果的提示,或者它们隐藏了正在产生神奇效果的模型。

因此,对于我们来说,我们相信,不,你今天使用的模型与明天的模型以及所有提示和其他一切。我会更改这里的黑盒。所有内容都是可消化的、可查看的和可检查的,一直到最后。我们有点

我们很长时间以来一直称这些为食谱,是的,当然,是的,真的就像这些是配料,这就是我们如何制作这种混合物,你知道,你可以从那里开始制作,是的,所以所有内容都是可分叉的,然后再次像 js fiddle 一样,你进行一次更改,这是一个新的 url,你可以与你的朋友分享,你知道,下周我们将推出工作区,以便你们可以协同处理这些事情,并带有版本历史记录,以便你们可以说,嘿,我有一个静态端点,比如我的酷代码助手,我们可以一起处理它,并且

然后你可以做一些事情,比如将它直接连接到平台内部,连接到 WhatsApp、Slack 或 Facebook 等内容。这实际上是我觉得被低估了的部分,让这些东西在通信工具上运行,这比你想象的要难得多。好吧,所以我想消除那里的摩擦。对。我想提一下,你知道,我不知道,这是过去的事情了,我报道过移动电话行业,我不知道,也许我们,

我们有一个很棒的观众,所以他们可能知道。但是,你知道,对于以美国为中心的观点来说,人们不一定理解,在世界上的许多地方,你的手机就是你的电脑,就是这样。人们正在共享手机,或者,你知道,获得一部手机使用一天之类的事情。但所有事情都发生在手机上。没有笔记本电脑,没有台式工作站,所有这些东西。而且

当我,你知道,在准备录音和阅读 Ulungizi(农民聊天机器人)如何通过 WhatsApp 进行操作时,你知道,就像,哦,酷。我想,好吧,当然是这样,因为这就是人们工作的方式。所以,你知道,也许回到你刚才说的,Sean,关于将这些工具放入通信平台中。

在处理这个问题时,遇到了一些什么障碍、一些挑战,也许还有一些令人惊喜的事情?不,有很多,对吧?所以我们有一个在我们网站上的演讲,叫做“出错的东西”,对吧?这基本上就像,

所以,你知道,在我们开始之后,再次,我们的老朋友,你知道,实验室主任 Anandana 说,嘿,负责 Digital Green 的 Rikin 正在工作。整个领域就像,你知道,用于发展的机器人将成为一件事情,这基本上是这部分

如果我们想说服世界上每一个农民基本上改变他们的生计和他们种植的作物,因为气候变化迫使他们在未来十年内这样做,我们必须说服他们所有人改变他们收入的来源。这是一个艰巨的挑战。世界上每一个政府都面临着这个挑战,因为地球上有数十亿人是农民。

所以他认识到这一点,就像,好吧,机器人将成为一件事情。你们为什么不一起合作呢?所以我们所做的是说,嘿,你知道,在 Digital Green 的案例中,他们有一个令人难以置信的图书馆,里面有数千个视频,基本上是一个农民记录他们如何更好地使用某种技术,然后向附近的其他农民展示。

农业最佳实践。农业最佳实践。你也可以将其视为所有在农业领域提出的问题,这些问题会提交给政府。然后是一些来自当地非政府组织的当地知识,例如 Google 文档,或者

人们应该做的事情,来自当地的非政府组织。所以我们所做的是说,嘿,我们已经构建了这个可扩展的平台,我们可以拥有 rag 机器人,我们知道如何很好地进行语音识别,我们正在运行所有最佳服务的私钥,此外我们还有自己的 A100 基础设施和 GPU 编排,所以我们也可以运行任何公共模型,所以我们可以说,很好,我们可以获取所有这些不是英语的视频,对其进行转录

基本上使用一堆 DP2-4 脚本来创建围绕它们的合成数据,这样它就不只是 CRAN 脚本,而且还包括从业者实际上可能会问什么问题以及答案是什么?然后使用所有这些来基本上将其塞入一个大型向量数据库中,对吧?然后说,好吧,我们然后将其连接到 WhatsApp 上,然后在前面放置翻译 API 和语音识别 API。

然后,砰的一声,你突然有了可以在多个国家使用多种语言的东西,使用本地参考内容,并带有可以向当地的小型股东农民提供实际帮助的任何语言的引用。这就是我们在 2023 年 4 月与 Rikken 在联合国大会科学小组上展示的内容。

对吧?所以你现在看看世界各地,机器人是一件很常见的事情。我不是说,显然,我们是参与这种转变的唯一人员。但我认为对我们来说令人兴奋的是,私营部门的许多人也注意到了这一点。而且

他们说,嘿,如果你正在考虑如何提高一线工人的生产力,那些需要修理你的空调或进行管道维修的人。对,对。他们有同样的问题,比如,我需要汇总在美国销售的每台空调的所有手册,以及所有相关的培训视频,再加上所有难题,以便我能够完成我的工作。哦,顺便说一句,该领域的所有资深技术人员都在 COVID 期间退休了。

对。所以没有剩余了。对。所以,但是你需要实现这一目标的技术实际上是相同的。因此,你知道,你会看到我们,我们经常谈论一线工人的生产力,因为我认为我们在这方面做得非常好,通过基本上汇总所有这些不同的部分。

这是一个冗长的答案。是的。你多次提到的一件事是语言。而且,你知道,许多模型,我的意思是,英语,无论好坏,都在接管,传播,无处不在,等等,对吧?并且许多模型都是用英语训练的,你们正在使用各种语言,包括,据我了解,大量的当地方言,以及,你知道,模型不一定经过训练的内容。

对。解决这个问题,对。谈论翻译等等。你们是否也在使用,你知道,用这些语言训练基础模型,或者只是通过这样做来更好地解决这个问题,我可能理解错了,所以请纠正我,但我认为我理解为翻译回英语,然后使用它来与大型语言模型一起工作?

这再次回到了 GUI 的核心理念,即我们总是希望成为其他所有内容的超集。我个人认为,作为一个小型初创公司,我的意思是资金不到 10 亿美元,试图训练任何基础模型都是愚蠢的行为。是的。对。因为每六个月你都会被超越。

所以我将把它留给那些可以投入 1000 亿美元或更多资金的人。然而,每一天,我都想知道,这是否更适合我的用例?我们采用这种非常特定于用例的评估方法,这就是黄金问题,然后将其应用于,嘿,我在印度普特南郊外有 50 个农民说这种特殊的方言

Borge boring,对吧?这是他们提出的问题。这是对 Borge 的专家翻译或转录。这是对该问题的专家翻译。这是我的黄金集。然后我们允许你这样做,说,我要运行

这个基本上是定制的评估框架,涵盖每个模型和这些内容的每种组合,以便在本周我可以告诉你,嗯,Facebook MMS 大型语言模型实际上比 Google 的 USM 效果更好,而 Google 的 USM 可能突然比,你知道,GPT-4.0 音频效果更好,对吧?而且

基本上允许组织评估哪些当前最先进的模型,特别是这些模型的组合,最适合它们的用例。所以我们有评估级别,而不是训练级别。

这是一个用户亲自动手的事情吗,弄清楚要使用哪个模型,哪些组合?或者这是平台为用户做的事情吗?这本身就是另一个工作流程。所以 gooey.ai/bulk,对吧?你可以上传你自己的黄金数据集,然后你可以说,很好,我想这样做。再次,你可以看到我们为其他组织所做的所有工作。然后你可以说,很好,他们就是这样做的。我可以复制,不是复制,我可以分叉他们网站上的食谱。

那里的优势在于,你不需要运行 DevOps 来运行所有这些最新的最先进的模型。不,绝对是。我正在与 Sean Blagsfett 和 Archana Prasad 谈话。他们是 GUI AI 的联合创始人,这是一个低代码、改变世界、从字面上改变世界的平台,用于将 AI 模型用于各种事情。但我们特别讨论的是一线工人,无论是 HVAC 技术人员还是非洲农村社区的农民。Sean,你提到过,我在开头就预告过,你现在谈到了黄金集和黄金问答。所以我想问你关于这个问题以及关于幻觉问题的问题。如果,你知道,我使用聊天机器人来帮助我的写作工作,它产生幻觉,我可以阅读它,这是一回事。

如果一个农民或其他任何人正在向一个聊天机器人询问关于他们生计的最佳实践,幻觉,从字面上来说,是生死攸关的事情,这是另一回事。你们是如何处理这个问题的?

所以有很多技术,对吧,我认为在那里。是的。你应该怀疑任何时候有人说我们完全没有幻觉。所以有 rag 模式,它说,嘿,我会搜索你的文档、视频或你放入的任何内容,我只会返回。然后你得到这些片段,然后你要求大型语言模型对其进行总结。

那里的幻觉风险降低了,对吧?因为你说,嘿,我正在总结一些简单的段落。老实说,对于农业之类的事情来说,这可能没问题。对于医疗保健之类的事情来说,这可能不行。因为在我们的管道中经常发生的事情是,你采用这种,你知道,总结,然后进行翻译。而这种翻译,你知道,对于英语到西班牙语来说,很好,我们可能不会有问题。但是英语到斯瓦希里语,英语到基孔戈语,

你想说,我不相信这一点。所以,对于我们看到的其他技术,如果你真的想要做到没有幻觉,那么你所做的是将用户的查询转换成对你的数据库中已有的问题的向量搜索,其答案已经被例如医生批准过。你的问题最符合哪个?然后你给出的信息不是对用户问题的答案,而是如何。

嘿,这里有一个相关的问题,我认为它在语义上与你的问题非常相似,并且有一个医生批准的答案。然后你基本上使用你的分析,对吧?来说,嘿,用户查询与我拥有的问题库的频率和距离有多远?然后,你知道,我可以去获取更多可以从医生那里获得验证答案的问题,并随着时间的推移使这个库越来越大。这就是你实际上如何消除幻觉的。因为它是一种搜索。是的。

所以这个黄金集是你随后搜索的经过验证的问答。用户看不到这一点。Sean 做了个鬼脸,抬头看着我,所以我停了下来。哦,是的。所以这两件事是不同的。好吧。就像我刚才说的,知识库是什么样的破布图案?是的。

黄金答案实际上是特定用例的评估框架。好的,好的。所以你可以把它想象成大多数大型语言模型都将 MMLU 作为它们应该参照的基准,它会问研究生一些关于有机化学等方面的问题。但这并不会告诉你如何修理空调。它不会告诉你如果下了暴雨,你在乌干达中部使用这种特殊的肥料该如何种植。

为此,你需要一个不同的评估集,对吧?所以这个黄金集基本上是我们对某人如何引入他们自己特定用例的评估集的答案。然后我们有一套,你知道,基本上你上传这些问答对。然后你说,这是使用 GPT-4 的机器人版本之一。这是使用 Gemini 的一个版本。这是使用 Cloud 的一个版本。我将运行所有这些。然后我们所做的是允许你指定......

我们有一些默认选项,哪个答案在语义上最接近你的黄金答案。然后我们根据此创建一个分数。然后我们,你知道,对该分数取平均值,然后给你一个答案。就是这样。因此,这允许你使用非常灵活的框架来进行一些评估。任何关于,是的,冗长的技术方面,例如,我们如何知道它很好。很好。

所以对于 Geerta 研究所,我们正在研究如何让社区,特别是妇女和少数族裔性别,来定义他们自己的数据集应该是什么样子。如何创建一个最能代表其社区或其价值观的数据集。他们如何使用这些数据集来创建,你知道,微调模型,使社区内或社区外的其他人能够

使用他们创建的这些数据集来制作图像,甚至制作动画。所以这是一个我们这个月即将启动的令人兴奋的新项目。而对于 UDAV,实际上,我们正在研究如何......我认为他们激发了工作区......

我们现在已经推出的功能,即我们如何让他们的年轻毕业生甚至他们的博士生能够快速开始使用人工智能工具,在不必了解 DevOps 部分的情况下进行尝试。我不会。这需要我

大脑的另一部分来弄清楚。我同意你。所以,你知道,我们如何才能让参与他们项目的人群?我们正在研究 DX Arts 项目,这是一个实验艺术项目毕业生能够,你知道,快速开始创作东西,而无需所有

Sean eloquently and in great detail has explained somehow. Sean 以某种方式雄辩而详细地解释了底层的东西。但也要以协作的方式进行,对吧?我觉得这就像一个隐喻部分,它会回到人工智能工作流程标准,也就是说,Word 已经存在很长时间了。然后我们转向了 Google Docs,我们对实时协作处理文档的意义有了巨大的突破。你会想,哇,我可以提高很多效率。

当然。一起。看看像 Amplitude 这样的分析工具,Amplitude 说,你过去使用过数据分析。就像我经营过一家公司,我会在那里开设 SQL 培训课程,因为我想在我的公司内部普及数据分析。但是然后是 Tableau,或者在 Amplitude 的情况下,Amplitude 出现了,我可以和你分享一个 URL,就像,你知道,查看我们的用户分析一样。如果你想将视图从每周视图更改为每日视图,只需下拉即可。是的。对。

然后,你知道,Webflow 可以说是从像 Photoshop 这样的独立桌面工具,到云端协作工具,做了同样的事情,对吧?我们认为我们可以对人工智能工作流程本身做同样的事情,对吧?这样,再次,我们正在研究这些事情,我不必担心它们下面的底层模型。你正在更高层次的抽象上工作,在那里我可以在一个团队环境中工作和查看输出。

这对学习非常有用,这就是 DX Arts 的部分。而且,你知道,这对提高一线员工的生产力非常有用。然后,当我们把这些东西做得越来越大时,你想做同样的事情,嘿,如果我有一组图像集,我们觉得它在像 Dolly 这样的东西中代表性不足,我可以使用该图像集来创建我自己的模型,然后,突然之间,可以围绕某种土著艺术形式制作动画风格,对吧?它不存在那里,因为数据不存在。这就是我们将与 GoTapes 一起做的工作。

这就像同样的隐喻不断地建立在彼此之上。我认为我们发现这部分非常令人兴奋。

Archneft,当你与女性、少数民族或任何类型的弱势群体合作时,尤其是在更多农村地区,再次,可以通过电话访问,而像尝试在线查找 Sora 这样的事情,甚至不在,这是一个不同的视角。你是否发现人们对

不仅对学习如何使用人工智能工具感兴趣,而且对在数据集中得到体现也感兴趣?这是你必须从头开始解释的事情吗?我之所以这样问,部分原因是,你知道,我们特别谈论的是艺术,对吧?以及弱势群体。你知道,有很多反弹,人们谈论,你知道,被低估或拥有......

他们的作品未经许可就被使用。所以从另一方面来看,与那些,你知道,来自完全不同视角的人合作的体验是什么样的?谢谢你,Noah。这实际上是一个很棒的问题。

所以我在,你知道,最近在曼彻斯特和 Islington Mill 的朋友们,我们进行了一次相当深入的谈话,几乎围绕着你问的同样的事情,那就是艺术家、创作者肯定觉得有很多阻力。他们受到了剥削。他们的作品,他们一生的作品都被剥削了。然而,现在,事情已经发生了。

我们无法倒回一些事情。但是,如果我们必须对未来进行一番窥探,我个人拥有的并且非常深刻地感受到的一个使命,而且我知道 Gouy 也和我一样,那就是我们已经过去了那一刻。就像,你知道,三年前,四年前,当我们做 Radbots 项目时,它是,嘿,我们能否让艺术家受益?我们能否给他们提供工具?然后他们可以制作他们想制作的东西吗?我认为我们已经过去了那一刻。

我认为我们现在所处的位置是,他们需要制作自己的工具,然后用最能满足他们需求的工具制作他们想制作的东西。这就是我们现在在 GUI 中所处的位置。我们如何让用户创建他们自己的微调模型,让他们能够例如创建他们想看到的图像或动画,他们想

用它来代表自己。这只是它如何发挥作用的一个例子。我觉得这方面存在着紧迫感。一是,在制作这些工具的过程中,他们会更加了解。我们一起学习。而且,你知道,工作场所模式也正是如此,那就是我们一起学习得更好。我们一起做得更好。而且,嗯,

我们越能让人们,尤其是富有创造力的思想家和活动家参与这项技术,这个世界就会越好。绝对的。不,这很好。绝对的。所以进入我们结束前的最后一个主题,标准。是的。Sean,你刚才谈到从,你知道,Word 到......

到 Google Docs 以及这种协作环境。HTML 显然是一个标准的绝佳例子,它随着时间的推移而发展、分裂,但我们都在使用网络,对吧?你如何在快速发展的人工智能世界中处理标准?

过去总是有教训,对吧?所以如果我......我们希望如此,无论如何。我们希望如此,对吧?我们希望我们从过去吸取了教训。但是如果你看看 HTML,HTML 允许网络之间进行计算机到计算机的通信,对吧?但也具有另一个因素,我认为这完全被低估了,那就是 view-source。

对。就像我学习编码并弄清楚 HTML 布局将如何发生的方式是因为我剖析了 Discovery 的主页。然后还有其他一些比较新的,我认为也具有指示意义,例如 Kubernetes。对。就像,你知道,你把时钟倒回 12 年。亚马逊基本上垄断了云服务器配置和部署。

因此,Kubernetes 从本质上来说是来自像 Google 这样的新兴二号和三号玩家,对吧?他们说,嘿,我想让从一个平台迁移到另一个平台变得非常容易。如果我有一个可以描述我需要配置的标准,那么突然之间你就不会有供应商锁定。

这使得云基础设施业务不会被一家公司主导,而是拥有,你知道,现在至少有三大巨头加上全球许多本地供应商。你可以使用相同的 Kubernetes 文件来表示,这就是我需要的所有内容。所以我们认为在......

围绕人工智能工作流程方面存在类似的情况。现在已经发生了。就像你拥有像 OpenRouter 这样的工具,它允许你非常轻松地切换你的大型语言模型。但是,你知道,我们的观点是,如果你可以定义这些高级接口,例如大型语言模型的功能是什么?你输入一些文本,你得到一些文本输出。也许你输入一些文本和图像,然后你得到一些文本输出。也许现在是一些音频

对。但是,你知道,你看看语音识别模型的接口是什么?它就像,好吧,你输入一些音频,也许给它一个语言提示,你期望得到一些文本输出。然后再次,你想交换任何底层的模型。所以一部分是这些模型有一些标准接口,然后这些接口成为步骤。然后你可以将它们组合成本质上是一个链,一个层叠链或类似的东西。

但在稍微更高一点的层次上。然后这些步骤最终成为你的配方。但是随之而来的是黄金数据集。

这允许你说,嘿,我有我期望的输入和输出集。然后我有我应该采取的当前步骤集。然后我可以自动更换模型,因为新的模型会发布。然后,砰的一声,告诉你,你应该真的使用这个,它更好、更便宜、更快。然后那个高级的东西,那就是人工智能工作流程标准。它基本上就像,你的步骤是什么?

分散在任何给定人工智能模型的使用之上,也许你对要公开的函数调用也有一些了解,就像,你知道,开放式 API 配置一样。那么评估方面呢?而且,你知道,我们的信念是,如果你有那个高级的东西,那么你可以用它来说,哦,我想在云上运行它,或者我想在 GPT Builder 上运行它。我想在 GUI 或 DeFi 或 Relevance 上运行它。然后我们突然有了这个,再次,这个可移植的东西允许你运行。

对于收听的各位,以及任何人,但我希望将其面向那些刚接触这项技术或来自非开发、DevOps 背景,而更多来自艺术家、活动家、作家背景的人。

或者,你知道,那些与那些认为提升这些声音并帮助他们创建他们想要使用的工具很重要的人一起工作的 DevOps 人员,对吧?你会对那些认为自己有新的方法去做,或者只是想参与正在这样做的组织的人说些什么建议?你会告诉他们什么?

开始吧。进入 GUI.ai。这很容易。如果有任何问题,请联系我们。它们很容易解决。它不像感觉的那样复杂。这就是我们的平台。还有其他一些平台也试图使这些流程更简单、更快、更高效。我认为这是很大一部分。

我认为没有时间浪费。我认为现在是时候了。担心它或批评它没有任何意义。必须参与其中,制作东西,然后可能制作你需要的障碍和防护栏。你知道,要抓住牛角。是的,很好。

GUI.AI 网站,GUI.AI,很棒。有很多用例、很多技术信息、视频,很棒的资源。除了 GUI.AI 网站之外,你还会将听众引导到其他地方吗?社交媒体、合作伙伴项目,其他任何地方?我会在你思考的时候拼写出来,G-O-O-E-Y,给听众。没错,是的。

我想补充一点,你不能仅仅关注技术就能创造出改变世界的优秀技术,对吧?这实际上只是手段。所以,我认为人们开始关注的事情是,对我来说,它实际上回到了,你正在解决什么问题?你真的有一些看起来像黄金问题的東西吗?这意味着......

如果你能想象一下,嘿,我们可以免费为全国每个人提供优秀的公共辩护人,那会是什么样子,对吧?那套专业知识会是什么?如果我们可以说,嘿,对于任何一线员工,我将成为他们的护士导师,帮助他们进行分类,处理他们能想到的每一个世卫组织指南,并用他们自己的语言给他们正确的建议。

对。这是一个对真正的专家系统真正需要的。所以不要想太多技术方面,而是想一想实际上存在的问题,现在有一个专家在那里,从能力建设的角度来看很昂贵?对。这是一个我可以做得非常好的地方。

我们已经收集了来自人员、流程和元流程、所有 O1 和文档以及视频的智慧。我觉得在明年,即使考虑到我们目前在大型语言模型中看到的局限性,我们也可以做好这一点。所以对于人们来说,我会说你必须找到值得在你的社区或你的企业中解决的问题。他们说,如果我能让人们拥有那个专家,他们会赚更多的钱,做得更好,活得更长,你知道,过上更好的生活。

生活,并且不要太关注技术,而是关注那部分。然后,如果你能做到这一点,那么,你知道,技术工具很容易。

Arjuna Prasad、Sean Blagsvet,非常感谢你们加入播客,告诉我们关于 GUI.AI 的信息。我会再次为听众说,GUI.AI。这很容易。去看看吧。还有很多事情要做,你可以做很多事情。感谢像你们这样的人,你们让越来越多的人更容易参与进来,得到代表,并创建他们解决问题所需的工具。谢谢。谢谢。谢谢。

AI for Everyone: How Gooey.AI Empowers Global Frontline Workers with Low Code Workflows - Episode 244 40:36 Share

The AI Podcast

Deep Dive

Shownotes Transcript

AI for Everyone: How Gooey.AI Empowers Global Frontline Workers with Low Code Workflows - Episode 244