欢迎来到Practical AI播客,这是一个让人工智能实用、高效且易于访问的播客。如果您喜欢这个节目,您也会喜欢我们每周五的访谈节目和精彩的脱口秀节目,让您的周末更加充实。您可以在任何收听播客的地方搜索“changelog”找到我们,感谢我们Fly.io的合作伙伴,您可以在五分钟或更短的时间内启动您的AI应用程序。了解更多信息,请访问fly.io。
朋友们,今天我和我的朋友米卡·格兰尼斯在一起,他是WorkOS的联合创始人兼首席执行官,我们都是WorkOS的忠实粉丝,迈克尔,请告诉我AuthKit是什么?AuthKit与WorkOS有什么关系?为什么WorkOS要创建它?
我们很早就开始做身份验证方面的工作了,但最初我们主要关注的是单点登录(SSO)和SAML。但一年后,我们听到更多的人说他们希望我们能涵盖所有身份验证方面的工作。他们想要双因素身份验证,想要密码管理,想要阻止重复使用的密码。
他们想要与其他第三方系统集成,他们希望我们能帮助他们处理所有围绕时间、身份、用户配置,甚至更高级功能(如基于角色的访问控制和权限)的业务逻辑。因此,我们开始更多地思考这个问题,我们如何才能以API的形式提供这些功能。然后我们意识到,我们与Radix有令人惊叹的合作经验,Radix是一个用于构建前端体验的组件系统,每月下载量达数千万次,它正是为此而设计的。
所以我们将这两件事结合起来,构建了AuthKit。AuthKit是向任何应用程序添加身份验证的最简单方法,而不仅仅是Next.js。
如果您正在构建Rails应用程序、Gino应用程序、Strapi应用程序或Express应用程序,它都附带一个托管登录框,您可以自定义它。您可以设置样式,您可以构建自己的登录体验,它非常灵活。
您可以以无头的方式只使用后端API。但开箱即用,它为您提供了构建和服务客户所需的一切,并且它与WorkOS平台集成在一起,因此您可以非常快速地添加任何身份验证功能。许多公司开始使用它,因为他们预计市场会增长,他们希望服务企业客户,并且他们不想在这样做的时候不得不重新设计他们的身份验证架构。
所以这是一种让您的身份验证系统为未来的增长做好准备的方法。我们有一些公司已经这样做了,他们从AuthKit开始,只是试用一下,做一些反向客户获取,然后他们获得了Coinbase、迪士尼或联合航空公司这样的主要客户,而不用说,“哦,不,对不起,我们没有企业级功能,我们将重建一切”,他们只需进入WorkOS仪表板,选中一个复选框,就完成了。
除了AuthKit本身很棒之外,真正棒的是,它对最多一百万用户免费。是的,一百万月活跃用户包含在内,所以从第一天开始就使用它吧。当您需要扩展到企业级时,您已经准备好了。
太容易了。了解更多信息,请访问authkit.com,或者访问workos.com。我们非常喜欢它,请查看一下,对用户免费。哇。workos.com或authkit.com。
欢迎收听Practical AI播客的另一期节目。在这些节目中,我和Chris会努力让您了解AI领域发生的一切,并希望分享一些可以帮助您提升机器学习技能的内容。我是Daniel Whitenack,我是Prediction Guard的首席执行官,我们在那里为私有和安全的AI部署AI平台。和我一起的永远是我的搭档Chris Benson,他是洛克希德·马丁公司的一名首席AI研究工程师,你好吗?
Chris:我很好,Daniel。我今天在户外录制播客,很兴奋。这是一个凉爽的十一月夜晚。
但我刚搬家,我没有地方坐,这里只有箱子。我们今天在户外谈论AI。这是户外AI。
Daniel:是的,是的。你住的地方在十一月可以舒适地待在户外,这太棒了。感恩节快到了。是的,有点冷。
Chris:在中西部,我们肯定要进入那个中西部时期了,这时羽绒服会出来,蜜蜂……是的,一年中的好时候。这意味着感恩节就要到了。没错。
Daniel:感恩节就要来了,火鸡也快来了。火鸡……是的,即将到来。太令人兴奋了。有些火鸡比其他的好。所以这是一个关于火鸡的播客,或者关于火鸡的播客。但有些火鸡比其他的好,嗯,也许让大家自己想想,如果他们正在探索这个领域的话。
Daniel:我们需要一些AI生成的火鸡食谱。
Chris:你知道,一定有一些交叉点。没错。也许Tofurky今年正在使用AI来生成广告文案,这让我想起,我不知道你是否看到新闻上关于可口可乐AI生成的广告的所有内容,Chris,你看到过吗?你见过那些广告吗?
Chris:我没有见过那些广告,但我看到了一些……
Daniel:关于它的新闻。是的,是的。所以对于那些不知道的人来说,可口可乐,你知道,每年可口可乐都会制作这些标志性的圣诞节广告,有可口可乐卡车,北极熊等等。
而今年,至少,我不知道是不是所有的广告,但至少有一个广告,我没有关注具体的细节,但至少有一个广告是完全由AI生成的,或者至少是由AI生成的视频片段或图像驱动的,诸如此类。我在流媒体服务上看到过它,在……我忘了是哪个,可能是Prime,因为现在基本上就像有线电视了,但它们都有广告。
所以我在流媒体服务上看到了可口可乐的广告。是的,我认为那些没有看到它的人应该去看一看。我认为很有趣的是,它的一些元素会给你那种AI生成的感觉,对吧?你可以看出,但它确实唤起了可口可乐广告的那种风格。
很多人不喜欢它。很多人认为它很有趣。我在LinkedIn上看到一些人说,AI生成的视频已经足够好到可以用于可口可乐的圣诞节广告了。那么还有什么东西是不够好的呢?这可能是一个大胆的观点?我不知道,Chris,你有什么想法吗?
Chris:我只是有点惊讶,人们现在对此感到惊讶。你知道,这就像……你会到处看到这些东西。所以,好吧,标志性的东西,我理解,但我……我的意思是,我几乎会惊讶如果……
Daniel:是的,而且……是的,如果你搜索可口可乐广告,我认为它是“真正的魔法假日”,这也很讽刺,因为它们标题是“真正的魔法”,但它绝对不是真的,但你可以观看它。它非常有趣。我认为它是一个问题,它是否是一个真正非常好的广告素材。我认为这肯定是一个标志,AI生成的视频已经和我们在一起了,并且会持续下去。所以几个月前,演员们罢工了。但我只是认为,这只是我们还有很长的路要走的事情之一,不仅仅是在娱乐业,在大多数行业都是如此,你会看到公司视频是AI生成的,我已经看到这种情况了……嗯,我见过可口可乐的,但我……你知道,我见过一些公司在这么做。这就是现在的方式……
Daniel:是的,当然,像Synthesia和Pictory这样的视频生成公司,用于培训视频,用于多种语言,所有这些东西,有很多这样的用途。我肯定看到了这种颠覆。说到颠覆……
Chris:男孩。
Daniel:我们还没有在节目中讨论过这个,Chris。我认为我们俩都不想,至少我不想对这个话题发表任何深刻的意见,除了它对AI意味着什么之外。但我看到《时代》杂志上的一篇文章,关于唐纳德·特朗普的获胜对AI意味着什么。
所以,如果你是在未来某个时间收听这个播客,而不是选举季节,也许你正在回顾这个,并且你知道唐纳德·特朗普的第二任期对AI意味着什么,但在这一点上,我们并不一定知道,尽管我们可以……你知道,我们可以做一些猜测,我们可以讨论,但是是的,我们即将进入第二届特朗普政府……所以,如果你在其他时间收听这个,而不是我们讨论这个的时间,那么……嗯,很有趣……我们已经看到拜登政府做了一些与AI相关的事情,包括关于AI的行政命令,我们在第244集中讨论过这个。所以,如果你想知道我们是否提到过它,并且你想知道这个行政命令的细节和有趣的部分,那就是第244集,我们会在节目说明中链接它。但是是的,很有趣,作为一名从业者,你对这有什么初步看法?
Chris:我可以告诉你我希望这意味着什么,我希望……你知道,在第一届特朗普政府期间,他对AI不太了解。他带来了一些企业人士来组建一些委员会,他们知道……他们从中得到了一些网站等等,但在当时并没有对我们产生太大的影响。所以我希望……也许……也许会很温和……让他谈论撤销其他事情,但也许他还不够了解AI来这么做,当然,又过了四年……谁知道会发生什么。所以有点……有点紧张地想知道他的政策会把我们带到哪里,但我希望……
Daniel:更少干预。是的,是的。所以,在《时代》杂志的文章中,这是文章中的一句话,我们可以把它放在节目说明中,它说:“特朗普自己对AI的声明在赞扬和担忧之间摇摆不定”,有点像……你知道,把它描述成一种超级大国,或者非常令人担忧。
Chris:对,对,也许吧。但我想,作为仅仅是撤销拜登政府的一些事情的一部分,可能已经承诺了,我们可能会预期……你知道,更普遍的是,承诺要废除关于AI的行政命令,以及……你知道,可能还有其他事情,我认为这会阻碍创新,你知道,对很多事情采取反监管的态度。
所以,有承诺要废除它。我不是一个足够了解法律/政治/政治分析的人,无法知道这到底会取消什么,因为……你知道,我认为行政命令在它触及的各种事情中都有其影响,这些事情可能与行政命令没有直接关系,比如NIST AI风险框架等等。所以我不知道这到底是怎么运作的。也许这是我感到困惑的一点。
Daniel:是的,我的担忧是,我认为,如果你没有对拜登所做的一切产生负面反应,那么实际上有一些事情是现任政府和即将上任的政府应该能够达成一致的。其中一个例子,只是一个例子,是“芯片法案”,它试图在美国迅速提高半导体能力。
如果你……如果你所在的政府是反华的……或者……你知道,关注中国,那么你就会认为,这项法案,特朗普已经说过他支持,你就会认为这是双方都能同意的事情。但他还说过他会废除“芯片法案”。我担心……这个……行政命令,因为它是他可以废除的东西,这只是一个权宜之计,可能会受到影响,然而我认为他这样做会犯一个错误,关于他自己的政府。我认为这会造成问题。
Chris:是的,我们提到的那篇文章甚至谈到了这一点,即……有一些说法是……我们需要更多的芯片和更多的芯片生产,对吧?但与此同时,正如你提到的,特朗普竞选活动攻击了“芯片法案”。
Daniel:我看到……你知道,当然,有些事情仍在进行中,我认为这符合“美国优先”的芯片生产部分和编码。我刚在新闻上看到,英特尔获得了高达79亿,接近90亿美元的“芯片法案”资金,用于帮助在亚利桑那州、新墨西哥州、俄亥俄州和俄勒冈州建设或扩建芯片工厂,其中包括2024年晚些时候的10多亿美元。所以我知道,特别是俄亥俄州的工厂,所有这些都在进行中。
我不知道这方面的具体细节,但是……但是有些事情正在进行中。所以对我来说有点令人困惑。我敢肯定,大型公司的首席执行官们正处于……他们正在努力与合适的人取得联系,并了解发生了什么。我再次假设,我不知道所有这些事情在幕后是如何运作的,但我假设……有很多这样的洗牌正在进行,以了解情况。
是的,我希望如果有人在听,嗯,可能是即将上任的特朗普政府的一部分,让美国再次伟大正是芯片法案的本意。坦率地说,我认为人工智能行政命令也是如此。所以我觉得,我希望这两件事不需要喝彩,尽管汽车很贵。也许,也许他会让他们继续下去。
是的。你对特朗普政府对开源或闭源的潜在观点有何看法?对此有何想法,就可能如何影响一方或另一方而言?
我那时真的不知道。我认为这取决于谁,这取决于谁在他的内阁中,可能更具体地说,是谁在白宫工作,以及他们对它的看法是什么,我对此无法置评,是的。
我看到对此有很多看法。我认为有一种观点认为,虽然中国从开源人工智能中受益匪浅,嗯,他们不仅一直是模型构建者,而且还在人工智能领域创造了许多技术,而且他们也从,你知道,Meta和美国人工智能技术中受益匪浅。
所以,有一方面是,好吧,让我们像他们试图限制其他事物的出口那样,限制它。但我也看到另一种说法,即,你知道,你基本上所有的监管,它可能不会具有限制开源人工智能世界的特性。所以我觉得有点不清楚。我当然是一个那种使用未来的人,更重要的是,在安全、隐私意识强的行业中,真正由开放的自托管模型驱动。我认为这是确保安全、隐私、透明性的方法。
是的,我认为目前有很多模糊之处,因为如果你看看传统的保守主义,如果你看看里根,你知道,因为很多共和党人真的回顾过去,开放贸易是巨大的。但我们也听到特朗普谈论关税。这是本周的新闻。你知道,这有点相反。所以很难判断球会落在哪里。
好的,朋友们,一件事。
我现在痴迷于使用Notion AI。是的,我是一个Notion用户。我不得不说,我把它用于自己,我把它用于Changelog,它非常有效地组织一切。
随着Notion AI的加入,它是一个单一的工具,它可以在Notion和其他应用程序中进行所有搜索,生成文档并采用我自己的风格,它可以处理PDF和图像,并且可以与我分享任何内容。现在你可能知道Notion是组织任务、跟踪你的习惯、制作漂亮的产品以及你所做的一切的完美场所。它改变了你工作中的上下文,这简直是革命性的。
与专业工具或传统的瑞士军刀不同,你不会在六个不同的应用程序之间来回切换。Notion无缝集成,无限灵活。是的,它看起来很漂亮。是的,我痴迷于Notion AI,因为我几乎可以问它任何问题,它就在那里为我服务。它超级快,并且与我在Notion中拥有的所有内容相关。
今天就免费试用Notion,访问notion.com/practicalAI,所有字母都是大写,notion.com/practicalAI。今天就试用功能强大、易于使用的Notion AI。当你使用我们的链接时,你就是在支持我们的节目,这太棒了,再次强调,notion.com/practicalAI。
在关于政府和人工智能的讨论中,有一件事被提及,那就是人工智能和中国之间的讨论,人们认为,你知道,人工智能在中国蓬勃发展,也许中国正在领先。人工智能,我知道我们之前在节目中讨论过这个问题。关于中国的人工智能,有一种说法。
每次在节目中讨论政策决策时,都会考虑其中一个因素,我认为其中一个相关因素是最近Qwen基础模型的普及。所以,如果人们不知道,我认为最近一件有趣的事情是阿里巴巴的Qwen系列模型,拼写是Q W E N,最新的模型是Qwen 2.5系列模型。一般来说,这些Qwen 2.5模型非常令人印象深刻。
它们通常在各个类别的开放式大型语言模型排行榜上名列前茅。你会看到它们在榜首。所以很明显,这些是中国模型。
这些模型是由一家中国公司阿里巴巴构建的。Hugging Face的首席执行官在一篇文章中引用道,你知道,Qwen 72B是王者,中国模型正在占据主导地位。
这是一个非常明确的声明,那是今年夏天早些时候。但我认为我们已经看到这些模型持续占据主导地位。克里斯,对此有什么有趣的看法吗?就你所看到的模型格局从封闭式模型提供商转向开放式,也许是地理位置更加多样化,当然中国也包括在内。
我在一个行业工作,我在国防情报部门工作,很明显,我们不会使用中国模型。所以我们一直没有关注这一点。我们当然会跟踪所有外部信息。但这并不是我们可能使用的。
但我真的很想知道,在我的行业之外,我的意思是,我喜欢得到人们对他们正在做什么的反馈。我认为有很多行业不会关心,会选择排行榜上最好的模型。但我实际上并没有和做过取舍的人谈过。
是的,也许这是一个有趣的题外话,因为我认为有些人并不了解与这种模型相关的潜在安全风险。所以我们说这是一个在中国生产的模型。有些人会感到不舒服,因为中国使用数据的方式或他们使用这项技术的方式。
但是如果我们看看模型本身,你可以去Hugging Face搜索Qwen模型,所以Qwen模型是开放的,你可以去Hugging Face。这是一个模型库。你可以直接找到Qwen模型。你可以下载模型的权重,并将该模型加载到你自己控制的基础设施中。所以,当你想到模型时,它由提示符和运行该模型的模型代码组成。
所以,如果你去Hugging Face上的模型,你可以下载它,这类似于如果你去GitHub,查看GitHub上的所有存储库,GitHub上的一些存储库将具有安全注意事项或许可证,不允许你使用它们或你信任的来源,对吧?这里有点意思,因为这些模型被加载到由Hugging Face、Transformers库或其他服务框架维护的代码中,对吧?所以,如果你自己托管模型,这意味着你从Hugging Face下载模型文件,并将它加载到可以服务该模型的代码中。
该模型服务在你自己的控制之下,你正在下载这些文件,这意味着你可以检查它们,这并不意味着与它们相关的没有安全漏洞,但最终所有这些都在你的控制之下。这与连接到提供Qwen模型的API的情况不同,阿里巴巴和其他公司提供了一些API,这些模型实际上作为一家中国公司的产品托管,你知道,你正在将你的数据发送到该API产品,然后它处理你的数据,并从模型中返回你的响应。所以我想强调这两种情况。
所以,在一个场景中,安全漏洞实际上与你加载的模型文件有关。模型文件中是否存在任何安全漏洞?当你加载这些模型文件时,是否使用了任何第三方代码?你使用什么服务框架来服务它们?这些都可能存在安全漏洞。
在另一种情况下,你依赖于其他人控制的基础设施,这可能在阿里巴巴的控制之下。所以这些只是不同的担忧。你想办法,嗯,我认为也许应该强调一下,因为有些人甚至想在像Llama Studio这样的东西中尝试Qwen模型。我不会保证所有安全考虑因素都可能在你脑海中,但我认为当你使用Llama Studio中的Qwen时,底层代码中不一定存在某种向阿里巴巴发送信息的机制。
我认为在美国政府部门。只是为了澄清一些事情,我认为这更多的是政策问题,而不是。
所以我认为你会有一些机构下载所有模型,进行审查和检查等等。但我认为对于典型的使用情况,你会看到更多。但我认为你更有可能看到一个美国。
机构或公司,嗯,服务于美国政府,将专注于Meta,而不是,你知道,阿里巴巴。我认为这是一个政策问题。
是的,是的,当然。我认为你说得对。我认为我只是看到围绕这个问题有很多困惑。
这是一个很好的澄清。任何时候你使用Qwen模型,它都在窃取你的数据。但是可能有一些方法可以以适合你的场景的方式使用它。当然。
就像你说的,如果你在国防部门工作,这将是一个与你在个人项目中拼凑一个很酷的人工智能代理的情况不同的考虑,你知道,为了个人目的,所以这些在光谱上相差甚远。所以是的,非常有趣。不。嗯,还有一些最近的发展。
所以,现在已经是11月下旬了,但这大约是一周前的事,Qwen-Turbo-1M发布了,这是这个模型的一个新版本,它将Qwen 2.5语言模型的上下文长度从128k扩展到100万个token。所以这就是一些上下文。其中一些类似于150小时的成绩单或3万行代码?或者这些东西,所以很多上下文可以放入这些模型中,你知道,这是一个持续的趋势,我对它有自己的看法,但这似乎是一个持续的趋势。
你不能把这个放在那里而不去那里。
是的。好吧,我只是认为,如果你考虑一下我与客户合作时遇到的最常见的企业案例,大多数情况下,这些案例符合我认为可以用大学水平的实习生完成的情况,对吧?所以你有一些非常明确的指令来完成这种工作流程,它可能是多步骤的,它可能是一个复杂的工作流程,但总的来说,你可以把它分解成一个序列。
这些指令就在那里。所以,如果你去一个大学水平的实习生那里,你说,去后面的仓库,那里有,你知道,成堆的文件,现在做这个任务。犯罪,对吧?这要困难得多,潜在失败的可能性也更大。
然后如果你去仓库,你通常会找到分配给任务的部分,你说,嘿,你知道,看看这几堆文件,然后做这个任务,你更有可能得到更好的结果。我认为这些模型,你知道,类似地表现。在学术研究中已经观察到了一些证据,例如遗忘中间上下文的内容。我相信这个播客中的人会说,不,丹尼尔,这已经解决了,无论如何。这只是我自己的一些经验和轶事,就什么被发现有用而言,是的,一百万个token很多,所以可能。
比大多数人需要的多。
我知道在这个播客中出现过的人,也是我的同行,他们完全不同意我刚才说的话。所以没关系。我想我们都在摸索着前进。
所以Qwen 2.5与我们围绕中国与美国辩论的一些讨论相交叉。但是,人们可能感兴趣的各种模型,在过去几周内出现了一些模型。我认为我们没有,这是一个疯狂的,所以我们做了一个新模型自助餐类型的简短介绍。
嗯,有一些有趣的模型,其中一个来自DeepSeek,它之前发布了一系列非常好的编码模型。但他们已经发布了DeepSeek-R1-Light预览版,这与ChatGPT-One或OpenAI-One有点类似,这是一个暂停并思考事物的世界,它试图解决非常复杂的问题,你知道,数学基准测试或其他东西。所以你实际上看到这个DeepSeek模型在许多情况下,对于某些基准测试,甚至比OpenAI-One在许多基准测试中做得更好。所以我认为这进一步证明了前沿的封闭模型提供商和开放模型提供商之间的差距正在迅速缩小。在我看来,在人们想要做的很多事情中,基本上已经没有区别了,无论你想要使用开放模型还是封闭模型。
所以,让我问几个相关的问题。第一个问题是,如果我们看到新闻中有很多关于最近达到极限的消息,你知道,眼睛睁得大大的,谈论未来模型的延迟,因为它们正在达到实际的限制。人们离开了。组织的结果就是这样。总的来说,我们在过去一两年中看到过行业中的这种讨论。当我们这样做时,你认为这是否是我们将会继续看到模型演变的地方,而不是仅仅变得更大,你知道,更大的上下文窗口,所有这些总是更大,总是更好,我们开始看到这些,呃,你知道,这些预览或一种预览风格,呃,它们暂停了,并且引入了全新的技术来解决某些类型的问题。我们是否也正在走这条路以及其他路?
是的,是的。我认为,至少从我的角度来看,正在发生的一件事是,从更多数据和更大模型中获得的收益基本上已经达到平稳期,这已经被观察到,这意味着较小的模型,人们正在努力为其创建数据并在效率方面进行创新,正在迅速赶上更大的模型。
所以,六个月前或三个月前只能通过70B模型或400B模型甚至600B模型实现的事情,现在正由7B模型或更小的模型完成,对吧?所以你有了这个小型模型的趋势,这些模型的实际性能水平远高于以前所能看到的水平。然后,你开始转向各种……无论是专业化或领域,还是独特的提示或格式技能。
例如,文档解析或视觉等等。Hugging Face最近发布了Small LVM,这是一个小型模型,可以执行某种视觉相关活动。还有OuteTTS,这是一个非常高效的,你知道,三亿五千万和五亿参数的文本转语音模型。
我认为这两个都代表了这种小型模型的专业化,并且在特定的事情上做得非常好。然后,我认为你会看到尝试继续开发新型的微调和提示方法,例如DeepSeek和类似于代理相关工作流程的东西,我认为人们将更多地深入研究这些。所以,也许更多的是关于工作流程、提示格式、提示策略,而不是仅仅是更大更好的模型、更大更好的数据集。
我和我的好朋友大卫在一起,他是Retool的忠实粉丝,非常喜欢用Retool构建内部工具。但是大卫,不是每个人都知道如何使用Retool。你能用Retool构建什么?
所以,Retool非常适合构建任何类型的CRUD应用程序,你主要关心的是安全性、身份验证、授权以及面向内部的事情。如果你想构建一个,比如说,像谷歌地图这样的东西,可能不应该使用Retool。你会使用自定义驱动程序、范围、React,非常复杂的应用程序。
如果你可以用Retool构建一个CRUD应用程序呢?我们是否会看到,特别是对于那些经验较少的前端工程师或对前端不太感兴趣的工程师,他们会更倾向于Retool。因为对于后端工程师来说,有时你只想做的是,你想得到一个可工作的原型,你想测试一个API,例如。而快速启动一个应用程序原型要比尝试学习React、学习Redux、学习状态管理以及学习前端的所有这些不同的部分快得多,这太复杂了。所以我认为后端工程师特别会倾向于使用Retool来构建快速的原型。
好的,朋友们,构建内部软件的最佳方法是访问retool.com。你可以轻松地连接数据库,使用优雅的组件并在其之上添加你自己的代码,你可以在几分钟内完成任务,而无需学习React,无需学习Redux,并节省时间来处理最重要的事情。再次强调,retool.com,免费开始或预订演示retool.com。
克里斯,说到我认为很酷,甚至可能很实用的一些事情,我们可以分享给正在努力提升技能的人们。其中一个很有趣,是我本周计划尝试的事情之一,是我发现的或有人向我推荐的东西,叫做GetPickle.ai。我还没有尝试过这个。
我今天才发现它,但它不是pickle。如果你是一位Python程序员,pickle对你有非常具体的意义,它是一种序列化格式。但如果你不是Python程序员,是的,如果你访问getpickle.ai,这似乎正是我期待已久的东西,那就是,呃,一个相当不错的标语:加入会议,使用克隆,这就是我一直想做的事情。这个想法基本上是,你会有一个看起来很专业的视频,你可以躺在床上,你知道,不穿裤子,戴着耳机,你的音频会通过你的克隆传到一个看起来非常专业的人身上,这个人加入了Zoom电话或其他任何电话。但你永远不必穿裤子,或者,你知道,诸如此类的事情,或者你在开车,但看起来你好像在办公室里,对吧?
对我来说看起来很棒。我完全同意。
关于这个事情,是的,非常有趣。我的意思是,呃,我不知道这种事情以及其他事情,比如AI化身等等,对工作的关联元素意味着什么,当我看到这个的时候,我想到的是,好吧,我能更进一步,只是让一个大型语言模型生成我的回应,然后只是坐在那里听我的克隆说话,对吧?
我只是想坐在那里听我的克隆替我开会,然后在我需要纠正某些事情或介入的时候,打断我的克隆并接管我的克隆的思想,因为大多数时候,克里斯,我不知道你怎么样,但我大多数会议都像是,嘿,我们要轮流介绍每个人,没问题,我的克隆可以介绍我,然后你轮流说,你知道,你对这个项目的最新进展如何?粘贴一个文档,习惯性的更新实际上并没有很多事情是我在会议中做的。也许这会让我被解雇,或者降低我在工作中的价值。
当你自己的老板时,你不用担心这个。
是的,就像,呃,偶尔有一些重要的事情,但是,呃,是的,我很好奇这种情况发生时会怎样。
我只是在想,在企业界,人们参加的所有例会,你只是汇报你的情况,而且正如你所说,你已经把你的情况写下来了。你已经把它训练好了,用于介绍。你可以躺在床上半睡半醒。
让它处理你的轮次。你唯一需要担心的是,如果有人开始问一些超出你训练范围的问题,如果有人突然转向一个不同的方向,你必须准备好介入。但是,你知道,我可以想象我的很多会议都会被这个功能接管。我也很乐意这样做。
我不知道,就像我说的,这会怎样?因为一部分,比如说,以每日站会为例,工程团队的每日站会或类似的东西。我认为,我并不是Scrum大师,但其背后的想法的一部分是,你知道,也要真正倾听,你知道,其他人正在进行的更新。
也许这会影响到他们是否在某些事情上被阻塞,你可以回复,或者影响到。所以我很好奇,如果它在已经远程工作的分布式环境中造成更多潜在的隔离,会发生什么。我的一部分,我有一个朋友,马克·西尔斯,向马克致敬,如果你正在听。
他正在一个名为Spout AI的风险投资工作室工作。他们其中一个关注点是,他们想用AI构建技术,来促进人们之间的关系。所以,举个例子,克里斯,你和我可能是朋友,我们都很忙,都是专业人士。
所以,有一个AI助手,它可能会查看你的日历,查看我的日历,查看我们镇上正在发生的事件,或者符合我们双方兴趣的事情,然后给我们双方发消息说,嘿,你知道,周四晚上你们都有空,在你们镇上有一个这样的活动,你们……这是一种很酷的事情,它能促进人们之间的关系,让他们走出家门,对吧?我认为这种能够促进人们之间关系的具身AI的想法,在当今时代非常有吸引力,也是我们所需要的。但我也很喜欢用我的克隆参加会议的想法。所以我不知道如何将两者结合起来。
但我告诉你,我完全同意,但你知道,你谈到的是让大家走到一起建立真正的联系等等。我只是设想它会接管,你知道,约会世界,你知道,我已经很久没有接触到那个世界了,我希望我没有……
我没有想到这一点,但现在想到了。
我只是设想,你知道,单身男人和单身女人,都在酒吧里,但他们都不太自在。他们派他们的代理人去联系,就像代理人一样。他们派他们的代理人去筛选,没错。代理人互相筛选,决定是否为绿灯或红灯,并弄清楚……我可以想象,我女儿还太小,不能约会,她才十二岁,但我可以想象十年后,你知道,她会有一个这样的代理人,你知道,通过让代理人互相检查来找到她的男朋友。所以,谁知道会发生什么。
是的,我想在他们网站上的小视频中,他们有一张女人抱着婴儿的照片,对吧?她在打电话,你知道,用克隆参加会议。
所以我绝对可以看到这个的各种救生员元素,在那里,你知道,可能会有污名,比如你参加一个媒体,你知道你的配偶和……比如你必须在你在家工作的时候处理你的婴儿,对吧?这可能不是你感到舒服的事情,或者不幸的是,在某些情况下会被接受。所以,是的,我绝对看到了这个的某些方面,但我同时也想知道所有这些的隔离驱动力。
这是一个非常好的观点。让我们暂时离开AI驱动的会议这个概念,如果我们回到几年前,Zoom开始流行的时候,我们都在努力进行远程会议,我们在容忍度方面变得更加宽容,你知道,你的工作生活如何与你的个人生活交叉。你知道,如果狗在背景中吠叫,人们学会了对此完全没问题。如果有孩子或婴儿,人们学会了这一点,呃,我们正在谈论这个特定的事情,关于拥有那个克隆,这有点像逆转了这一趋势,并且变得有点不那么宽容了,呃,因为你再次投射出完美的形象,无论你是在车里,在玩具室里,在床上,或者你碰巧正在做的事情,你都不想透露。所以,所以,我认为这是那些事情之一,以这种方式使用它也可能具有隔离性。
是的,很有趣。我认为,呃,看看人们如何利用这些方法,将会很有趣。就像我们在这个技术中看到的许多事情一样,它有恢复性、积极性、救赎性用途的机会。而且,它也可能以某种方式让我们陷入隔离或造成问题。但是,呃,是的,呃,在AI相关的与生活方式相关的事情方面,我最近看到了一些关于AI中的支付、商业和购物的帖子,首先是Stripe的一篇博客文章,它讨论了将支付添加到代理工作流程中。
呃,我想现在有了更好的工具来使用Stripe代理工具包,如果你访问github.com/stripe/agent-toolkit,你现在可以将Stripe作为工具或AI代理可以利用的东西,包括来自LangChain、LlamaIndex或AI SDK的那些代理,这绝对很酷,比如,AI,我需要你为我预订下周的租车,对吧?显然,这需要某种支付方式。我也可以看到,在另一端,现在是一位企业主,我很乐意说,嘿,为这个客户创建一张发票,一张针对这个客户的定期发票,金额为这么多,包含这些项目,并将其发送给他们,并附上消息,但你知道,无论这些是什么,这里肯定有一些可能缺失或有问题的事情,但看到这方面的发展肯定非常非常有趣。
我认为从代理的概念来看,这是一件很棒的事情。我知道人们需要时间来信任它并习惯它,但在我们家,我们现在倾向于购买杂货并送货上门,因为我们很忙,而且很多时候,我们买的东西和上周一样。
但也许会有一些变化,因为你计划在周末的某个时间吃不同类型的饭菜。想想看,如果你能将代理与支付功能结合起来,并能够以这种方式让你的生活更轻松。我知道我们家会喜欢这个。如果这个功能可用,我妻子一定会为之疯狂,她喜欢这种卸载任务的感觉。
还有一个我不知道他们是否在幕后使用了Stripe API,但还有一个参与者,那就是Perplexity现在提供了一种购物助手,它背后有一个实际的体验。因此,你可以输入诸如“我正在做这个项目,我想做这个和那个,需要哪些物品,帮我买这些”之类的信息,我认为这就是它的感觉。
你知道,显然会进行搜索,并且这与各种产品相连接,在这种情况下,他们有一个商家计划,这绝对看起来……我不知道关于ChatGPT的插件和其他东西的一些货币化问题发生了什么,但这绝对似乎是一种让你的产品……你知道,我的妻子在直接面向消费者的领域和销售项目产品方面有一家企业。有一种尝试去弄清楚,好吧,我该如何放置我的产品,或者我的产品如何在人们在ChatGPT、Perplexity等平台上搜索时出现在搜索结果中?所以这似乎是一个角度,你可以增加成为推荐产品的几率。
有支付集成、API、自定义仪表板访问等等。Perplexity AI驱动的购物助手也具有商家计划元素。非常有趣。
非常好。我期待着……我刚刚采用它,我现在准备好了。是的,随着人们……
构建他们的购物助手,使用Stripe或其他公司的API,或者如果你正在构建你自己的东西……在节目的最后,我们通常会引导人们关注一些有用的东西。我将在过去几周遇到的几件非常有用的东西中提到几件。
其中一个叫做Docling。你只需搜索“Docling”,它就会出现在show notes中。所以这似乎是一个非常好的工具,我看到很多人提到它与文档解析相关,这通常是一件非常困难的事情,而且在许多AI工作负载中都很难做好。
并且围绕各种复杂的文档解析情况构建了一些自定义模型。所以这是一种标准化的方法,可以将PDF、PowerPoint、图像、Excel文档和其他内容传递到标准化格式中。我看到的另一个非常酷的东西叫做Observers,我是Hugging Face数据集的忠实粉丝,所有这些工具。
它连接到所有这些,并允许你跟踪你对各种AI API提供商或你自己的模型发出的所有请求,并将它们保存在类似于DagsHub或类似的东西中,以便将来搜索提示的历史记录,但也将其用于观察和透明地记录和调试,也可能最终用于围绕提示的开源数据集,甚至在你自己的上下文中微调数据集。所以这两个都是非常有趣的新的项目,去看看吧。是的。
这很有趣,Chris。很好,我今天学到了很多东西。
是的,很高兴聊天。我们很快会再聊。保重。
好了,这就是我们本周的节目。如果你还没有查看我们的Changelog新闻通讯,请访问changelog.com/news。你会发现29个理由,是的,29个理由说明你应该订阅。我会告诉你第4个理由,你实际上……
开始期待它。
另外28个理由在changelog.com/news等你。再次感谢我们在Flatout IO、Breakmaster Cylinder和Beats的合作伙伴,以及你们的收听。现在就到这里,我们下次再聊。