今天,Chris 与 Shopify 的杰出机器学习工程师兼机器学习主管 Mike Tamir 和 Sidekick 的产品管理总监 Matt Colyer 共同探讨了 Shopify Magic 和其他 AI 产品。他们讨论了 Shopify 如何使用生成式 AI 和大型语言模型来增强其产品,并深入探讨了 Sidekick,这是一种首创的 AI 商业助理,它能够理解商家的业务(产品、订单、客户),并经过培训,了解 Shopify 的所有信息。 加入讨论Changelog++ 会员在本集节省 9 分钟,因为他们去除了广告。立即加入!赞助商:Fly.io – Changelog.com 的所在地 — 将您的应用程序部署到靠近用户的服务器 — 全球 Anycast 负载均衡、零配置私有网络、硬件隔离和即时 WireGuard VPN 连接。一键式部署,可扩展到数千个实例。查看快速入门指南,几分钟内即可上手。
Shopify Shopify 的 2025 冬季版
<raw_text>0 欢迎收听 Practical AI,这是一档让所有人都能轻松、高效地使用人工智能的播客。如果您喜欢这个节目,您会喜欢 The Change Log。周一发布新闻,周三进行深入的技术访谈,周五则是一档精彩的周末谈话节目。您可以在收听播客的任何地方搜索 The Change Log 找到我们。
感谢我们的合作伙伴 Fly.io。在五分钟或更短的时间内启动您的 AI 应用程序。访问 Fly.io 了解详情。
朋友们,大家好,我和 Fly 的联合创始人兼首席执行官 Kurt Mackie 在一起,正如您所知,我们喜欢 Fly,它是 changelog.com 的所在地,但 Kurt,我想知道您是如何向开发者解释 Fly 的,您是先讲一个故事吗?您是怎么做的?我解释的方式会根据我正在与之交谈的开发者的“代际”而有所不同,例如,我是在 Heroku 上构建和发布应用程序的,如果您从未使用过 Heroku,它大致相当于在 Vercel 上构建和发布应用程序,只是现在是 2024 年,而不是 2008 年或其他什么年份。
让我感到沮丧的是,我被卡住了。您可以使用 Rails 应用程序和 Postgres 在 Heroku 上构建和发布应用程序,就像您可以在 Vercel 上构建和发布 Next.js 应用程序一样。但是,一旦您想做一些有趣的事情,例如,当时,我认为我遇到的其中一件事是,我想添加曾经是 Elasticsearch 基础的东西。我想在我的应用程序中进行全文搜索。
在 Heroku 之类的平台上,您可能会遇到这样的障碍,您无法真正做到这一点。我认为最近我们看到人们希望将 LLM 推理之类的东西添加到他们在 Vercel、Heroku 或 Cloudflare 等平台上的应用程序中,如今他们已经开始发布抽象来让您做到这一点。但我不能只运行我在这些非常专业的黑盒平台上本地运行的模型。对于我这个年龄段的人来说,总是像,“哦,Heroku 很好,但我已经超越它了”。
在我使用 Heroku 时,我觉得自己应该能够做到的一件事是,将我的应用程序运行在靠近东京的人们附近,为在东京的用户提供服务。而这从来都不可能。对于现代一代的开发者来说,它更像是基于 Vercel 的。它更像是 Vercel 非常好,直到您遇到他们的硬性边界之一,然后您就卡住了。我们公司内部还有另一个,我不记得这个游戏的名称了,
标语是“五分钟启动,永远掌握”。我们推广 Fly 的方式大致如此,就像,“您可以在五分钟内启动一个应用程序,但该平台的深度如此之深,以至于您永远不会用完可以做的事情。” - 因此,与 AWS、Heroku 或 Vercel(这些都是很棒的平台)不同,
我们在 ChangeLog 最喜欢的 Fly 的一件很酷的事情是,无论我们想在平台上做什么,我们都有原语,我们有能力,我们作为开发者可以在 Fly 上承担我们自己的使命。这是一个为开发者构建的无限平台,我们认为您应该尝试一下。访问 fly.io 了解更多信息。在五分钟内启动您的应用程序。太容易了。再次访问 fly.io。
你
欢迎收听 Practical AI 播客的另一期节目。我是 Chris Benson。今天我独自一人。Daniel 无法加入我,但我们今天有两名嘉宾。我想向大家介绍 Mike Tamir,他是 Shopify 的杰出机器学习工程师兼机器学习主管,以及他的同事 Mike Collier,他是 Sidekick 的产品管理总监。先生们,欢迎来到节目。
谢谢,Chris。是的,感谢邀请我们。很高兴能有你们加入。我知道你们在 AI 领域做了很多很酷的事情。因此,感谢你们两位的加入,来介绍它的不同方面。对于那些可能加入但可能听说过 Shopify 但可能不是用户或不熟悉的人,在深入探讨所有优秀的 AI 方面之前,你们能否谈谈?
在深入探讨所有优秀的 AI 方面之前,你们能否谈谈 Shopify 作为一家公司的情况,以及你们如何看待你们所处的领域?你们满足什么需求?在进入 AI 方面之前,先了解一下你们业务的一些基本情况。是的,我可以先说,然后 Mike 可以补充一些内容。当然。是的,Shopify 是那些你可能不知道但你可能已经使用过的令人难以置信的公司之一,即使你没有特别意识到它。
我们的使命是打造您最喜爱的品牌背后的零售操作系统。您可以这样想。就像您家乡周围的连锁餐厅一样,对吧?但还有您最喜欢的咖啡店,由当地经营者经营,对吧?而且,这家咖啡店的东西更好,对吧?因此,Shopify 在互联网上的目标是让这些经营者能够在网上取得成功。因此,我们在网上为许多品牌提供支持。一些比较著名的品牌包括 Dropbox,
Drake、Patel、Gymshark、Heinz,仅举几例。因此,一些世界最大的品牌都在上面,但您当地的一些企业家也在上面。
您能否描述一下 Shopify 与其他(例如)信用卡处理商和购物车处理商的不同之处?我知道你们有自己独特的品牌,但我可以分享一下是什么让它与其他事物区分开来吗?我知道你们有自己独特的方式做事。
是的,我的意思是,这是一个完整的解决方案。所以,就像我们做电子商务一样,我们可以帮助您建立网站。我们可以帮助您围绕您提供的产品进行商品化。我们还提供支付解决方案。因此,您无需设置单独的信用卡处理器,但如果您有信用卡处理器,也可以使用它。我认为这实际上是 Shopify 平台最强大的功能之一,因为它拥有非常庞大的开发者生态系统。因此,我们的许多商家都会安装来自我们合作伙伴的应用程序来执行特定操作。因此,如果您有特定的平台
运输提供商,您可以使用他们的应用程序。如果您有特定的电子邮件提供商,您可以使用他们的应用程序。对于许多此类类别,我们也提供解决方案,但生态系统绝对是最丰富的部分。听起来你们还服务于从您刚才谈到的某些大型品牌到小型企业和电子商务以及中型企业等各种不同的细分市场。因此,
听起来你们使用技术解决方案服务于相当多的不同客户细分市场。是的,我的意思是,Mike,你想补充一下吗?我觉得你最近比我处理更多这样的事情。如果您考虑一下 Matt 描述的所有内容,建立网站、支付处理,这是您可以为大型成熟品牌以及小型品牌提供的基础设施。
近年来,尤其是最近几年,Shopify 一直关注的不仅仅是为您提供网站,还为您提供增长工具。这就是我们对机器学习和人工智能的关注以及我们转向机器学习和人工智能的原因。例如,我们有我们的商店应用程序,一个没有销售记录或历史记录的新商家可以加入我们。
该应用程序。当我们搜索时,如果我们了解后端机器学习并了解如何做好检索和排名,我们可以立即向客户展示一个新的商家。非常酷。补充 Mike 的话。我认为这很好地说明了他如何参与 AI 组件。但 Shopify 的核心价值之一是,我们让商家始终处于技术前沿。
因此,我们认为我们的使命是深入了解技术,并始终在寻找最好的技术,然后弄清楚我们如何将其应用于商家的业务。对。因此,就像 Mike 谈到的那样,我们如何帮助我们的商家发展?对。那么,我们如何应用这些机器学习模型或这些 AI 技术,真正帮助这些人发展他们的业务呢?有了你们多年来一直在为所有这些企业提供支持的技术基础设施等等,对吧。
在什么时候,你们开始考虑近年来一直在兴起的这些 AI 技术?公司在什么时候开始认真地将 AI 视为业务模式中的一个支持因素?是什么让你们说,“我看到了一个机会,可以帮助我们的客户完成我们多年来一直在努力做的事情”?
那是什么转折点?那又是如何发生的,你们又是如何开始在业务中考虑 AI 的呢?我的意思是,了解时间线,我认为转折点可能是我们所说的“鸡生蛋还是蛋生鸡”的问题。嗯,而且,你知道,Shopify 历史上可能对机器学习和人工智能的投资并不多,但是,嗯,
到 2022 年,它已经对这方面感兴趣,并且肯定已经大规模地重新分配了我们的力量,Matt 和我加入并专注于过去几年的工作。当您谈到你们在那个时候加入公司并继续前进时,您能否谈谈一下这种愿景?你们
你们是如何看待你们正在执行的任务的?你们是如何在如何继续前进以及如何通过这项工作为客户提供服务方面将其具体化的?
我会给你一个产品经理式的答案。这听起来不错。听到 Mike 对此的科学回答很有趣。我认为这是关于找出世界上有什么。老实说,在那个时期,如果您还记得的话,感觉就像,我不知道,几百万年前,但三年前 ChatGPT 还不存在,对吧?没错。我们忘记了那是一个世界,但它确实存在。因此,我认为我们像 Shopify 的员工一样,对这项技术着迷,就像其他所有人一样。我清楚地记得有一个 ChatGPT 高峰期
时刻,我妈妈告诉我她如何让它写一首诗。因此,我认为全世界都被计算机能够写故事的事实所吸引。因此,我认为我认为
我认为这就是 Shopify 的文化,对吧?就像我们都是修补匠,我们喜欢构建,我们都在收到来自我们母亲的消息,告诉他们如何写出以前无法写的故事。他们就像,自然而然地,你就像,也许,也许有一种方法可以将其应用于商业。对。我很好奇,当这些新技术出现,你们进入公司并继续前进时,你们必须做出许多选择,在如何支持客户使用不同的技术和不同的方法来解决问题方面,你们有很多不同的选择。你们在技术和产品方面是如何考虑这个问题的?我会将我们的方法描述为毫不掩饰的。
我们对这些问题有多么务实,无论是开源还是 LLM 的商品提供商。我们倾向于选择有效的方法,并且我们确实会保持多个实验线程,使用所有这些不同的技术选项来解决每个问题。我认为这与……相符。
我们目前投入生产并正在积极使用的是,不仅包括您可能想到的所有基础模型,还有市场上存在的商品选项,而且在我们如何使用现有的开源版本方面也相当激进。正如我们所讨论的那样,您在那里提到了开源,我们还讨论了诸如通过 API 使用 ChatGPT 等产品化产品。
进入这个阶段,在您达到现在已经有很多我们即将讨论的事情的程度之前,您是如何从战略角度来分析的呢?您是如何说,“我们面临着这个挑战,我们是一家大型成功的科技公司。我们正在进入 AI 的美好新世界。”,而你们必须像……
弄清楚你们想用基础模型做什么?你们是托管自己的模型吗?你们会使用 API 吗?你们是如何考虑这个问题的?这不仅仅是从技术角度来看,而是从为客户服务等角度来看,你们是如何看待
不同观点的优势和劣势的。如果您能分享一下您在代表您自己的业务进行分析时的一些见解。回应 Mike 的话,我认为这是这个行业发展的早期阶段,对吧?因此,在这个行业发展的初期,变化很多,而且变化非常快。而且
我认为很难选择任何一种解决方案。我认为在这个新技术浪潮的开始,人们认为微调可能是答案,对吧?它就像,模型和上下文窗口将永远很小,而且成本很高。我认为它让每个人的预期都大吃一惊,因为事情变得便宜的速度有多快。我认为没有人能预测到这一点。因此,我认为……
这只是一个充满机遇的世界,无论是运营成本,还是另一件我想要说的是无法预测的事情,那就是那里解决方案的数量是无与伦比的。我不知道如果没有 Lama 权重的泄露,我忘记了在几月份,我不知道
我不知道我们是否会有我们今天拥有的开源社区,但自从开源模型的寒武纪大爆发以来,情况已经变得疯狂了,那里的一些创新令人难以置信。因此,我想说我们有一个总体规划。我们就像,“哦,是的,我们看到了,我们将使用这些商品模型,然后转向开源模型。”但现实总是比历史书面版本更混乱,我认为。因此,我认为所有这些的简短答案是,我们尝试了很多东西。我认为在这个领域获胜的人是那些尝试最多事情的人。
因此,我想说我们的总体策略是,我们尝试很多不同的东西。然后,就像 Mike 说的那样,我们有一种严格的方法来确定哪种方法最好,但这经常会发生变化。就像三个月前有效的一种方法,我甚至无法计算出我们在 Sidekick 上更换其核心基础的次数,因为我们找到了一种更好的方法。
我对此一点也不感到惊讶。我很欣赏这个答案,因为我认为这是所有听众面临的挑战,许多听众也面临着同样的挑战,因为它发展得太快了。昨天很贵的东西,随着新事物的兴起,成本正在下降等等。
因此,我喜欢你们快速实验、快速失败的概念,我想在你们的实验过程中,这样你们至少知道今天什么对你们有效,直到明天出现下一个东西。你们有没有想到过一些成长的烦恼,可以分享一下,就像,“哦,你知道,你把手放在额头上说,我希望我能预见到这一点”?
所以,我认为这是整个社区一直在实时解决的问题。就像 Matt 说的那样,您可以尝试不同的方法,看看
哪种策略最有效,哪种策略最有效,或者哪些策略组合最有效,并且会随着时间的推移而变化。因为我们确实知道,新的模型将不断发布,大型商品模型、小型开源模型、大型开源模型。我们一直在研究中学习,无论使用微调还是使用长提示或领域自适应的组合,所有这些都将处于不断变化的状态。我们应该相信,这种情况将长期持续下去。
因此,如果您有一个任务是,“嘿,我们对任何事情都持开放态度,我们将使用有效的方法”,我们必须对有效的方法有一个定义。这意味着,Matt 会笑,因为这是我们一起努力解决的事情,您必须调整好您的评估系统。这就是我们正在转向不同格式的工作,用于评估,特别是对于非结构化文本生成,用于确定此
这是一个好的答案。这是一个糟糕的答案。并能够以各种方式衡量它。根据具体情况,有各种创造性的解决方案。但是,确保我们有一种衡量方法,而不是说两个轶事就足以让我认为所有天鹅都是白色的。如果我们想对我们的解决方案采取务实态度,这是过程中的一个重要部分。
是的,我们有一个,我想说是一个团队故事。我们谈论它是黑暗森林。我认为我们都在努力,我们希望我们有 GPS 启用的手机来确定我们在如何走出黑暗森林的地图上的位置。但我想我们已经为评估找到了一种更实用的方法,就像指南针一样,这里的隐喻是,每个人都希望我们完全知道,
系统有多好,对吧?但我们已经找到了一种更实用的方法,那就是,“好吧,我们知道 A 比 B 好,对吧?”因此,如果您只是总共做出足够的决定,其中 A 总是比 B 好,您最终会走出森林,对吧?但我们希望知道这需要多长时间。问题总是,“好吧,你什么时候才能找到出路?”就像,“好吧,我们不知道。我们将继续做出我们所能做出的最佳下一个决定。”
好的,朋友们,我和我的好朋友 Avtar Swithin 在一起,他来自 Timescale。他们正在将 Postgres 定位于从物联网、传感器、AI、开发工具、加密货币和金融应用程序等所有领域。因此,Avtar,请帮助我了解为什么 Timescale 认为 Postgres 最适合成为 AI 应用程序的数据库。
根据 Stack Overflow 开发者调查,它是最流行的数据库。Postgres 的一个显著特征是它具有可扩展性。因此,您可以将其扩展到关系和事务数据之外的用例,例如时间序列和分析。这就是 Timescale 公司的起点,以及最近的向量搜索和向量存储,这些对于 RAD 等应用程序非常有影响力
推荐系统,甚至是 AI 代理,我们今天越来越多地看到这些东西。是的,Postgres 非常强大。它深受开发者的喜爱。我觉得更多的开发者,因为他们知道它,它可以让更多的开发者成为 AI
AI 开发者、AI 工程师,并构建 AI 应用程序。在我们看来,Postgres 确实是明智的选择。您无需管理不同的数据库。您无需处理数据同步和数据隔离,因为您有三个不同的系统和三个不同的真相来源。我们在其中一个领域的工作是
关于性能和可扩展性。因此,我们构建了一个名为 PG Vector Scale 的扩展,它增强了 Postgres 的性能和可扩展性,因此您可以放心地将其用于大型 AI 应用程序,例如 RAG 和代理等。然后另一个领域是,回到您刚才说的话,让越来越多的开发者能够利用他们已经拥有的专业知识,跃入构建 AI 应用程序并成为 AI 工程师的行列。因此,我们构建了 PG AI 扩展,它将 LLM 带入 Postgres,以实现
例如,在您的 Postgres 数据上进行 LLM 推理,以及嵌入创建。由于所有这些原因,我认为当您构建 AI 应用程序时,您无需使用新的东西。您可以只使用 Postgres。好吧,朋友们,了解 Timescale 如何使 Postgres 变得强大。超过 300 万个 Timescale 数据库为物联网、传感器、AI、开发工具、加密货币和金融应用程序提供支持,它们都在 Postgres 上完成所有这些工作。Timescale 将 Postgres 用于所有用途,现在您也可以使用它。
访问 timescale.com 了解更多信息。再次访问 timescale.com。
所以,伙计们,我喜欢你们对评估和找到走出森林的方法的看法。考虑到这一点,你们有很多不同的产品。而且,当你们引入这些新技术,进行这些评估,并试图通过这种方式走出黑森林,并在多个领域进行管理时,你们,
你们是怎么做的?你们是如何统一不同产品的,以便能够有效地为客户提供这些技术?你们是如何让所有乐高积木组合在一起并以可用的方式使用的?有一些类型的难题。似乎每种类型都适合一种或多种评估策略。让我用乐高积木举个例子。
搜索,对吧?以及评估搜索质量。一些良好的研究表明,LLM 往往更擅长对与查询相关的产品进行排名或标记,与查询不相关,以不同的分辨率,对吧?事实上,有研究表明,LLM 在此方面比人类更好。
你可能会问自己,为什么?为什么?克里斯,你是人类。你搜索了白色花朵连衣裙。
你会点击其中一个,对吧?其中一个将是针对您的查询的正确答案。然后我可能会搜索白色花朵连衣裙,而你搜索一个是因为你想要一件带有白色花朵的连衣裙。而我并不想要一件带有白色花朵的连衣裙。我想要一件白色连衣裙,上面有五颜六色的花朵。这两个都是对该查询的完全合理的答案。我们在这里看到的是,这实际上只是一个抽样问题。如果您考虑一下,有一个匹配任何查询的适当产品的分布。因此,每次我们询问一个人时,我们都会从该分布中获得一个样本。但如果该分布非常平坦,那么我们将对各种不同的答案进行采样。因此,我们在 LLM 中所做的是,您可以将其视为一个类比。早上,我喜欢填空,对吧?
有很多很好的答案。我喜欢运动。我喜欢咖啡。我喜欢早餐。我喜欢橙汁,无论是什么,对吧?有很多方法可以完成这个句子,而且它们都是合理的。只是这是一个非常平坦的分布。对于语言,我们所做的是,我们只是用样本接样本接样本接样本来压倒它,以便我们可以填充整个分布。在查询产品类型中,需要花费太多时间和成本才能
以这种方式大量填充该分布,直到您进入隐式反馈。
因此,您必须找到另一种解决方案。这就是为什么当您使用 LLM 并替换典型的 Terker 来填写这些答案时,您会获得更好结果的原因之一。现在,重要的一点是 Matt 和我曾在其他情况下看到过。你不能这样做是不接地的。你不能只让机器人给机器人评分,然后希望一切顺利。您必须有不同的专家监督来接地这些。
这些答案,无论是在搜索环境中、个性化环境中,还是在更多聊天环境中,例如 Sidekick 产品,您都必须有这种接地。一旦您注入了这种纠正措施,那么您就可以同时获得两全其美。
您能否谈谈不同的产品?您谈到了查询,您谈到了个性化,但还有其他您认为在您的世界中非常突出,并且您正在考虑将 LLM 或其他 AI 技术应用于的产品吗?我们有几个 AI 启用或魔法启用的 Shopify 产品。因此,Sidekick 是主要的一个,我们稍后会详细讨论。但为了让您大致了解,这是一个帮助商家购买的工具
找到绕过 Shopify 的方法,还可以回答有关其业务的问题。您可以将其视为他们希望拥有的 24/7 可用的、不加评判的联合创始人。这就是 Sidekick 的理念。然后我们还有各种各样的其他产品。因此,我们有很多图像。事实证明,购物,人们在购买之前想看看东西是什么。这并不令人惊讶。商家在扩展到拥有工作室、摄影师和其他人员的整个团队之前,通常想要能够做的一件事是,
他们想要增强他们现有的图片。对。因此,在他们所处的规模上,这就是技术,再次回到从前沿获取最佳技术并使其对我们所有商家都可用的地方令人兴奋。因此,现在已经存在这样的技术,您可以基本上将您想对图像做什么描述给它。你就像,“嘿,
嘿,我的背景有点乱。你能把它换成工作室背景吗?因为我们都知道那种好看的白色工作室背景,看起来像物体漂浮在太空中,对吧?就像,你可以在现实生活中做到这一点。但这真的很难而且很贵,你必须知道自己在做什么。而且很少有人能做到这一点。所以事实证明,我们创建的模型也能做得相当好。
所以把这项技术带回来,这是我们今天整合到Shopify中的产品之一,就是背景生成。因此,商家可以导入他们已经拥有的图像,将背景替换成更符合品牌的东西。比如,他们想把他们的咖啡放在丛林的背景下,对吧?如果他们愿意,他们可以把它放在丛林前桌子上的位置,或者也可以把它放在白色空间的虚空中。所以这有很多令人兴奋的机会。我们一直在投资的另一个领域是,我们有一款名为Inbox的产品,
它允许我们的商家与他们在网站上的买家进行交流。如果买家有一个问题,比如,“你们的退货政策是什么?”或者“我的订单在哪里?”他们可以通过收件箱与商家互动。所以我们今天提供的一项功能是,我们会查看所有商家的政策以及他们提供给我们的其他信息,然后可以帮助为这些常见问题制定答案,对吧?就像,“你们的退货政策是什么?”就像,“我们很确定这是答案。”然后我们可以向商家建议这一点,然后商家会说,“是的,没错。”或者如果不对,他们可以调整它使其正确,然后发送它。所以商家喜欢它,因为它节省了他们回答许多重复性问题的时间。然后对于那些稍微难一点的问题,他们可以像以前一样自己写。然后我想到的最后一个是,
或者再次回到产品和商品化的那种任务,那就是商家经常同时上传很多这些东西,对吧?所以他们并不总是第一次就能捕捉到所有元数据。所以这又是我们创建模型的地方,这些模型实际上可以帮助解决这个问题。所以,如果你上传一件白色花朵连衣裙的图片,我们有一个模型可以理解那张图片是什么,并建议说,“嘿,伙计,
“嘿,这可能是一件白色花朵连衣裙,应该归类在连衣裙下,比如棉布下。”而且它可能会建议,“哦,事实证明,如果你上传多种不同的颜色,那就好像,也许你想创建产品变体。”所以我们今天正在研究的其他技术就是利用我们从商家那里获得的数据,使他们能够通过我们的网站更生动地描述他们的产品。
对于收件箱,收件箱是Sidekick的一部分,还是与Sidekick相邻或平行?不,它是一个完全独立的产品。因此,商家必须选择安装。再次回到我们之前谈到的平台问题,他们选择安装Shopify构建的Inbox应用程序。然后在Inbox应用程序中,您可以选择使用此行为或不使用。您刚才也提到了生态系统。我很想知道,当你们创建这些新的AI赋能产品时,
生态系统是如何融入其中的?这是可能的?它们之间有什么样的互动?- 今天我们通过GraphQL公开了一个非常广泛的API,就像我们刚才谈到的数据一样,对吧?分类。所以无论商家决定什么,我们都会提出建议,他们会说,“是的,这是正确的。这件连衣裙实际上是一件连衣裙。”
一旦他们保存了更改,这些信息就会通过该产品描述API提供。我明白了。Matt涵盖了相当广泛的生成文本、生成图像、产品理解,所有这些都与图像生成相邻或某种程度上是不同的算法。还有一个方向,我们可以考虑一些我……它一直是我职业生涯中一份持续给予的礼物……
对于我的整个职业生涯来说,文本处理的机器学习技术通常也适用于商业。这可以追溯到旧式的矩阵分解推荐引擎,它也对理解文本很有用。
RNN,在transformer接管之前,用于查看序列或句子。也适用于文本。- 伙计,你带我回到了很久以前。我们做了很多关于RNN的节目,现在这看起来像是石器时代。- 是的,20年代的石器时代,对吧?- 没错。
同样,你知道,很多技术,你知道,它总是可以让你偷看你在语言中所做的事情,并为电子商务想出一个很酷的想法,反之亦然。这种情况并没有停止。我的意思是,transformer已经接管了一切,但是,你知道,
有一些不是完全的transformer架构,而是类似于transformer的重度注意力方法架构,可以查看商家的行为序列、买家的行为序列以及与我们的商家购物的人的行为序列。这些也是序列,并且可以以类似的方式进行处理,以便理解下一步是什么。
商家的旅程中的步骤,我们如何帮助他们完成这段旅程?我们有哪些可能的方法来模拟这种情况?这在我们应用机器学习的领域中一直是我们的前沿尖端领域之一。实际上,Mike的回答让我想起了,我想补充一个我总是忘记的产品。它也与我们讨论过的生态系统相融合。正如我相信你与节目的其他人士讨论过的那样,LLM令人兴奋的部分之一是编写代码的能力。
我们谈到了GraphQL API。因此,我们所做的另一个令人兴奋的应用是,为了我们的开发者生态系统,我们增强了我们的开发者文档,现在我们有一个集成的工具来帮助开发者编写代码。你描述道,“嘿,我想查找产品类别。你能帮我写出查询吗?”它会直接为你编写GraphQL查询。你可以复制粘贴它,直接把它放到你的应用程序中。
我认为我们仍然处于弄清楚如何应用这些LLM的早期阶段,这对于工程来说是一个巨大的转变,看到这些新的应用能够解锁现有的文档站点,并使其开发应用程序更加直接,这令人兴奋。
朋友们,你好!我喜欢我的8sleep。查看一下,8sleep.com。我从未睡得这么好过。你知道我喜欢生物黑客技术。我喜欢睡眠科学。而这完全是关于睡眠科学与人工智能的结合,让你在睡眠中保持最佳状态。这项技术正在突破我们卧室中可能性的界限。让我告诉你关于8sleep及其尖端Pod 4 Ultra的信息。那么Pod究竟是什么呢?想象一下
一个高科技的床垫套,你可以很容易地把它添加到任何床上。但这不仅仅是一个普通的床垫套,它配备了传感器、加热和冷却元件,并且所有这些都由复杂的人工智能算法控制。这就像拥有一个睡眠实验室、一个智能恒温器和一个私人睡眠教练,所有这些都集成在一个设备中。Pod使用传感器网络来跟踪你在睡眠期间的各种生物特征。
它跟踪睡眠阶段、心率变异性、呼吸频率、温度等等。最酷的部分是这个。它可以在你无需佩戴任何设备的情况下完成所有这些工作。它的准确性可以与专业睡眠实验室的水平相媲美。
现在,让我告诉你我最喜欢的东西。自动驾驶总结。每天,我的8 Sleep都会告诉我它的自动驾驶功能为我做了什么,以帮助我更好地入睡。以下是它昨晚所说的。昨晚,自动驾驶功能调整了你的REM睡眠,提高了62%。
62%。这意味着它更新并改变了我的温度,使其变冷或变暖,并帮助我精确调整了我想要达到的精确温度控制,以获得最大的REM睡眠。睡眠是我们每天进行的最重要的功能。正如你可能已经猜到的那样,我是8 Sleep的忠实粉丝,我认为你也应该买一个。所以去
8sleep.com/changelog,现在他们有一个很棒的黑五特惠,从11月11日到12月14日。折扣码changelog将让你在捆绑购买时最多获得400美元的Pod 4 Ultra折扣。再次,要使用的代码是changelog,时间是从11月11日到12月14日。再次,那就是8sleep.com/changelog。我知道你会喜欢的。我每晚都睡在这个上面,而且我
我非常喜欢它。这是一个改变游戏规则的东西,它将改变你的游戏。再次,8sleep.com/changelog。
回到你在谈话中较早提到的内容,你谈到了魔法和魔法赋能之类的东西。你能告诉我一些关于这方面的信息吗?我可能误解了。这是一个产品还是你们正在使用的支持技术?
我的意思是,这是一种我们指代事物的方式。我们应该做得更好一些来解释它。所以我们刚才谈到的所有事情,我们都认为是Shopify魔法品牌的一部分。就像产品分类的东西、文本生成、Sidekick、背景中的图像生成。所以这些都是Shopify提供的魔法功能。明白了。所以它是一种围绕所有这些事情的AI赋能品牌。
就是这样。所以,正如你所知,我们已经谈到了一些关于Sidekick的内容,我们已经经历了,还有一件事我一直想问你,那就是我们一直在谈论的你目前拥有的各种AI赋能功能
你对未来的发展是如何考虑的?你在关注什么?你,你知道,你会添加更多目前还无法公布,或者至少还不能公开谈论的内容吗?你如何看待你们今天所处的位置与你们在不久的将来可能做的一些事情之间的关系?稍后我们会谈到更远的未来。好的。
不幸的是,我今天无法回答其他即将发布的公告,但我认为我们可以谈谈一些有趣的一般性问题,对吧?足够了。Mike谈到了将旧技术以新的方式应用于特定商业领域。我认为围绕预测和定制的方面很有趣。我想说,就我个人而言,我认为让我兴奋的是其他模式。
回到之前的那个参考,像ChatGPT很酷。当语音模式出现时,我觉得我又经历了一次ChatGPT的体验。克里斯,我不知道你是否用过它,但它绝对令人难以置信。在典型的一天中,我一直在进行。我可能会说这很糟糕,但我可能与ChatGPT交谈的时间比与我妻子交谈的时间还要多。在我们之间。
谢天谢地,她不想再听到我的声音了。所以她不会在节目中听到这个。但是是的,我一直在就很多话题进行对话。所以这又回到了这样一个事实,那就是发展如此之快。你们必须将客户的需求与支持这些需求的技术相匹配。
你们现在正在考虑哪些事情,也许是你们在未来前进的过程中?更具体地说,你们是如何考虑处理当前不断变化的技术所带来的风险的?我们已经谈到了一些关于持续实验的事情,但也有一个点,你必须在不同的方向上进行投资,并做出权衡等等。除了支持你们提供的这些不断增长的能力的实验之外,你们是如何看待这些风险方向的?
你认为商业产品,例如,节目中经常出现的一个话题,你认为开源是否会克服这个问题并最终接管,因为前沿模型的进展正在放缓,而开源似乎正在更快地赶上来?你们在处理公司中的这些业务问题时,是如何考虑这些问题的?
我认为这很可能是混合的。所以,我知道我们谈到过我们的战略是像一直以来那样做所有事情。所以我无法想象商业产品完全接管的世界。而且我真的,我不知道我是否能想象开源完全接管的世界。我认为这对世界来说可能是一件好事。我认为这就是推动创新的动力,对吧?这就像两者之间的竞争。
有些事情一方擅长,而另一方不擅长。所以,我无法想象一个我们不在Shopify使用两者的世界。你能谈谈你如何看待各自的优缺点吗?考虑到事情变化的速度如此之快,这可能会在明天改变。但是,当你看到我们可能使用ChatGPT之类的商业产品或其他几个最大的竞争对手时,
与开源以及你们可能拥有的基础设施相比,你们是如何知道该去哪里的?例如,你们是如何知道要使用ChatGPT作为API,而不是使用存储在你们基础设施中的基础模型的?
好吧,我认为这可以追溯到Mike之前最喜欢的观点,那就是评估。我们必须拥有我们的指南针,因为没有指南针,我们就迷路了。这就是我们回答哪个更好的方法。但我认为另一部分是你问的,比如哪个在这一点上擅长什么?所以,我认为一般来说,表达方式是:开源。力量在于控制。就像你保证运行这个精确的模型,使用这个精确的训练数据,得到这个精确的结果。所以它非常可预测。你可以更好地控制训练过程和训练后的过程,并且
你只需要更多旋钮,对吧?但是权力越大,责任越大,对吧?操作所有这些旋钮并知道正确的数值是有代价的,所以对于你已经完全定义好的问题,并且你确切地知道你想要如何去做,开源就非常棒,对吧?商业模型的旋钮较少,但是……这方面很棒的是,你知道开箱即用的默认设置通常运行得很好,对吧?所以,
我认为如果你正在查看原型设计早期的内容,商业模型效果很好,对吧?它们可以让你快速从零到一。然后当你达到一的时候,你会意识到,“哦,好吧,我想达到2.0。”而且,有时这需要转向开源模型以获得额外的控制。这有点像你试图解决的问题有多大?如果你试图解决一个,你知道,一个中心化的万能的,你知道,你希望拥有的联合创始人,
我们将需要拿出所有武器,对吧?并且真正尽我们所能地利用尽可能多的力量,对吧?问题只是在这个时候,对于这项任务来说,什么才是最强大的?还有另一方面,也许我们试图解决的问题不是超级大的问题,而是更易于管理的问题,对吧?或者也许我们需要大规模地做到这一点。当然,商业模型正变得越来越快、越来越便宜。
但是当你需要大规模地做某事时,从某些模式中提取模型然后大规模运行它可能值得一试。如果查看我们的整个历史,我们拥有数十亿种产品。对于Matt描述的产品,我们理解所有不同的属性和分类法,并且我们规范了这些产品的描述,大规模地做到这一点是一项真正的工程壮举,我们需要努力完成。而将它发送到
GPT-01可能不是一个好主意,对吧?
绝对正确。一个问题,我猜,Mike,这是问你的。在过去的两三年里,我们一直非常关注LLM和生成式AI能力。我知道总的来说,该行业也开始回过头来看一些其他的东西,我们过去谈论过的事情,我们过去经常谈论的AI领域的其它技术。似乎在某些行业中,诸如强化学习和CNN之类的技术,
根据行业的不同,我认为根据我与不同人士交谈的经验,一些人发现这些其他架构在其他用途上是有用的,而另一些人则没有。
你们呢?你们主要关注LLM和生成式AI,还是有一些用例,我们最近没有过多谈论,但在业界仍然存在的一些其他技术,它们对你们来说是否发挥了作用?是的,这可能是我们剥离技术的地方。我需要再增加一层,对吧?在基础层面,任何神经网络都是一个通用的逼近器,对吧?所以如果我们有足够的数据
有一个足够大的神经网络可以解决,只是一个MLP,对吧?一个全连接的神经网络。当然。
所以我倾向于这样考虑,无论是CNN、重度注意力模型还是RNN,无论是什么,所有这些实际上都在做的事情是,即使神经元的数量可能太多了,对吧?我们可能需要过多的数据才能做到这一点。所有这些实际上只是为了减少我们需要的数据量,以便逼近我们想要的模式。
现在,可以肯定的是,重度注意力模型,无论是传统的transformer还是像你可能看到的2017年原始的“注意力就是你所需要的一切”transformer架构的演变到你在Llama中看到的那些。这些都像是调整,它们仍然非常关注多头注意力。还有一些像我为电子商务描述的技术,它们正在进行实质性的改变,例如从多头注意力中移除softmax,这是一个,你知道,
有点像10年前将sigmoid作为我们的激活函数一样。这只是一个错误,而且是一个社会学上的错误。所以看到像这样的微小变化,也许会让我们摆脱transformer架构,我认为我们肯定处于一个有意义的时代。
还有一些组合的东西,对吧?你提到了强化学习,还有GNN架构,这些实际上与视觉transformer兼容,用于规划和强化学习,你知道,使用transformer作为图神经网络的聚合函数。
所以这不是非此即彼,而是现在我们有了另一个工具,在第一种情况下,对世界进行建模,以便我们能够在我们的Q学习和策略学习中做得很好,或者在我们如何组织不同类型的节点、不同类型的(在我们的例子中是商家、产品和买家)时,能够很好地捕捉正确的信息。
话虽如此,还有另一种看待你问题的角度,那就是,看看transformer什么时候会结束,它们是否已经结束了?这实际上也让我很在意,因为每个人都在谈论,“好的,后transformer时代是什么样的?”所以,是的。我认为我可以这么说,而且我经常这样对我的学生说。我会在充分理解你永远不应该做出在你一生中会被证伪的预测的情况下做出这个声明。我很确定transformer不是最后一个架构。
在2012年之后,似乎有十年时间CNN几乎与视觉同义,对吧?而现在不是了。如果你在20年代后期问我是否认为它是,我可能会说同样的话。
这是一件很重大的事情。这是一个很大的赌注。CNN似乎是山顶,它们在图像分类方面做得如此出色。很难想象什么会取代它,但它可能不是故事的最后一章。
我认为你也可以对transformer说同样的话。有点讽刺的是,Mike,你用最后一个答案已经涵盖了这个领域,从你们每个人那里,我们通常在节目的最后都非常希望从我们的嘉宾那里获得对未来看起来是什么样的看法。
你们每个人都处理不同的领域,根据你们的关注点,你们可能会有不同的答案。Mike,考虑到你已经谈到了一些关于未来的内容,但是,尽管你评论说不要做出在你一生中可能会被证伪的预测,我还是会请你们两位都这样做。如果你正在展望未来,我会让你决定什么时间范围适合你。但是也许,你知道,超越短期诗意的表达,并试图说,你知道,你会看到什么?你想看到什么?以及你的各种工作以及你的公司如何为客户服务,你知道,你如何看待这种快速变化的曲折,让所有人措手不及?
你如何看待你们每个人对它的看法?Matt,如果你能先开始,然后Mike,我会再回到你这里。我认为最令人兴奋的是,我的意思是,当我长大后,我记得我们第一次上网的时候,当时有第一个ISP,有一个拨号调制解调器,还有一个BBS。就像……
那对我来说是第一波技术。这就是我进入这个领域的方式。然后我觉得移动革命让我措手不及。就像,我认为当第一部iPhone问世时,我想,“我需要一部这样的手机。”但我没想到的是,世界在那之后会发生多大的变化。而这一次,我不是Web3的坚定支持者。我想,“这是什么Web3业务?”但是,
我觉得这又是同一种转变。所以我只是忽略Web3。我认为这是真正的Web3。它是AI。那么这将如何发展呢?我认为这次的不同之处在于,在过去,我不知道,70年来我们拥有计算机,我们人类不得不适应计算机的工作方式。起初我们编写汇编代码。起初我们编写的是真正的比特。然后我们编写汇编代码。然后我们想,“也许我们应该有语言。”然后就像,“好吧,我们慢慢地爬行到那里。”
然后下一次革命是,“哦,我们应该有点击操作。”所以这些盒子。所以现在我们拥有一个世界,每个人每天都花8个小时点击彩色小方块,然后在其他彩色方块中输入键盘上的字符。我认为对我来说最引人入胜的是,我们已经塑造了我们自己,以适应当今计算机的工作方式。
但我认为在这个时间点,对不起,我现在给它10年的时间。不,没关系。所有这些都会改变。就像,我认为所有这些我们点击按钮来设置设置的浏览器,所有这些都会消失。我认为这将是我们与代理或某种无定形实体互动的方式,就像,
而不是,你知道,列出所有步骤,例如首先搜索这个,然后点击这个链接,然后做这个事情。就像,“我想买一盒牙膏。”然后代理说,“好的。你想买一个明天发货的吗?或者你想买一个更便宜的,但下周发货的吗?”然后你说,“更便宜的那个。”然后就完成了,对吧?你没有填写信用卡表格。你没有点击10个网站。你什么都没做。所以,我想我会押注于此。就像,我认为
网络将再次改变。我认为我们已经如此习惯于SaaS和所有这些模型,而且,我不知道这需要多长时间。这就是为什么我说10年后。我不知道。可能是3年后,也可能是20年后,但我认为20年后我们不会再在方框中打字了。很好的答案。
Mike,回到你这里。是的,我认为我会从两个方向来解释这个问题。几年前,我在自动驾驶领域花了一些时间。这是在自动驾驶的,我认为,最大炒作时期,我与之交谈的每个人都说,“哦,好吧,人们在五年内甚至不需要开车了。”而这已经是五年前的事了。而且
一方面,就在海湾对面,Waymo正在载人出行,对吧?规模还不够大,但确实如此,对吧?当然,很多人说我儿子永远不需要考驾照,而他
他即将拿到驾照许可证,对吧?所以,为了做一个类比,我认为期待Matt所期待的那种能够做到这一点的自动驾驶助手是合理的。我非常尊重Matt,因为他很小心地处理时间问题,不是五年或其他什么时间。这可能需要一些时间来磨平边缘。幸运的是,你知道,与……发生碰撞……
今天,Chris 与 Shopify 的杰出机器学习工程师兼机器学习主管 Mike Tamir 和 Sidekick 的产品管理总监 Matt Colyer 共同探讨了 Shopify Magic 和其他 AI 产品。他们讨论了 Shopify 如何使用生成式 AI 和大型语言模型来增强其产品,并深入探讨了 Sidekick,这是一个首创的 AI 商业助理,它能够理解商家的业务(产品、订单、客户),并经过培训,了解 Shopify 的所有信息。 加入讨论Changelog++ 会员在本集节省了 9 分钟,因为他们去除了广告。立即加入!赞助商:Fly.io – Changelog.com 的所在地 — 将您的应用程序部署到靠近用户的服务器 — 全球 Anycast 负载均衡、零配置私有网络、硬件隔离和即时 WireGuard VPN 连接。一键式部署,可扩展到数千个实例。查看快速入门指南,几分钟内即可上手。
Shopify Shopify 的 2025 冬季版
<raw_text>0 使用自动驾驶助理比使用自动驾驶汽车要安全得多。因此,我们可能会在那里得到不完美的模型。我会多拿五盒牙膏。这似乎是我小心谨慎的表现。所以,从侧面来看,你知道,我们很可能会,对吧?这些助理将会有一个自动驾驶的时刻,而距离多久才能实现这一点,我和 Matt 完全一致。你知道,在我们真正到达那里之前,我们会遇到一些障碍。
有一件事我非常有信心,那就是我们将改变我们组织、访问和利用信息的方式。这将成为一个我们自互联网早期搜索时代以来从未见过的强制性因素,这也是一种彻底改变我们组织和访问信息的方式。而且,你知道,很多
你将与之交谈的人已经表示,他们会在进行搜索体验之前先访问他们最喜欢的 LLM。关于什么是最好的方法,还有很多关于产品、界面和问题之类的问题。但是,再次借用 Matt 说的话,这是……
非常重要的一点是,当我们想要访问和完善我们正在寻找的信息时,我们现在实际上是用同一种语言进行交流。而这在以前从未发生过。说得很好。
好了,先生们,非常感谢你们来到节目中。这真的很有趣。我学到了很多东西。感谢你们分享你们未来的观点。我希望你们在事情发展并有更多想与观众分享的内容时能回来。感谢你们的到来。我很乐意。谢谢,Chris。谢谢,Chris。
好了,这就是我们本周的节目。如果您还没有查看我们的 ChangeLog 时事通讯,请访问 changelog.com/news。在那里,您将找到 29 个理由,是的,29 个理由说明您应该订阅。