今天,我们将与BlinqIO首席执行官Tal Barmeir一起深入探讨AI的未来,从AI驱动的软件测试到工作场所转型以及2025年的预测。这是一集你绝对不容错过的节目!让我们开始吧。另外,别忘了订阅IE+以获取高级见解和独家内容!</context> <raw_text>0 欢迎收听今天的Lexicon节目。我是克里斯托弗·麦克法登,Interesting Engineering的特约撰稿人。今天,我们将与Blink.io的首席执行官Tal Barmier一起深入探讨AI的未来,从AI驱动的软件测试到工作场所转型以及2025年的预测。这是一集你不会想错过的节目。让我们开始吧。
给自己一份知识的礼物。RU+是一个高级订阅服务,可以让你独家访问尖端故事、专家见解和科学、技术和创新领域的突破性成果。掌握塑造未来的知识,走在时代前沿。为了我们观众的利益,请您简单介绍一下自己好吗?
是的,我基本上是一个连续创业者。这是我和另一位联合创始人盖娅·赖利共同创立的第三家公司,所有公司都在软件测试领域。就教育背景而言,我来自商业领域,非常关注市场趋势以及与市场和产品战略理解相关的一切,尤其是在软件测试方面。好的,很好。那么我们进入下一个问题。
AI是如何重塑我们工作方式的?您认为它对科技和非科技行业工作的最深远影响是什么?
我认为很多人担心AI会如何影响就业市场以及我们的工作方式。但从我所看到的,以及我个人使用AI的领域(很多是关于市场营销、内容创作、研究、法律、行政运营),
它对我来说是一个很大的生产力提升器。它并没有取代我的职位,而是消除了过去我必须完成的大量非常枯燥的工作,才能做出决策并进行任何类型的判断。所以我认为
你知道,就像任何其他新技术一样,如果我们使用AI来完成那些需要较少人类想象力和判断力的重复性工作,我们实际上可以使我们的生活更加
高效,也更有趣。而且,我在科技领域(如编程、产品设计)以及非科技行业(如旅游等,其中大量的规划沟通如今都是通过AI代理和其他类似技术完成的)都非常清楚地看到了这一点。是的。
我明白了。那么,回顾过去,我们是否应该将其比作文字处理器、电子表格或数据库之类的东西?
是的,你知道,我很多时候都说它非常类似于拼写检查器。对。归根结底,如果你有它,效率就会高得多,需要做的重复性工作就会少得多。除了那些你本来就不想做的工作之外,它实际上并没有从你那里拿走任何东西。
是的,完全正确。它是一个提升器,不是吗?一个工具。把它当作工具,而不是你的替代品,基本上就是这样。反正我就是这么看的。好的。对于那些不是AI专家的人,这可能是我们大多数观众的情况,学习AI和将其整合到他们工作中的最佳方法是什么?我认为,这有点类似于电脑或互联网,首先,你可以将其用于你的日常工作。
与工作无关的事情,例如使用ChatGPT,它是免费的,或者任何其他AI引擎,开始规划你的旅行,搜索东西,比较,你知道,我有时在晚餐时,有人提出一个问题,然后围绕着它的实际情况展开一场小小的争论。而且,
你知道,我们只是把ChatGPT带入讨论,它会增添趣味,带来很多新的信息。我真的认为,开始使用它的最佳方法就是日常事务,很多旅行规划、购物等等。甚至,你知道,历史和理解一些政治和其他事情。然后
从那时起,一旦你理解了如何与它对话,
也可以用于工作方面。我听说有些人用它来代替谷歌,因为它更快,而且你省去了所有付费的搜索结果,返回结果,你知道,它更快。他们以此作为开始,就像维基百科一样搜索你一无所知的东西,然后在真实网站的基础上进行构建。是的。所以,
我认为这实际上是一个非常好的方法,因为首先,用它搜索更容易,因为你真的像和人说话一样与它交流。因此,你不需要对搜索词或提问方式进行任何操作。
所以我认为这是一个很好的入门方法。但最终必须对照实际网站和结果进行验证,因为它确实存在幻觉。所以,如果你只依赖它,你可能会发现自己
依赖一些不存在的东西。这种情况很少发生,但确实会发生。所以应该有这种意识。是的,很公平。我认为我是对的。ChatGPT已经开始提供来源了,不是吗?这取决于主题,但它会在最后给出链接,对吧?
是的。如果它没有,你实际上可以要求它添加。所以你可以问,如果你可以添加,你知道,我可以在哪里找到,你知道,无论是支持这个的网站,还是我可以在哪里预订我感兴趣的东西等等。是的,检查一下事实。你到底从哪里得到这个的?我说,哦,实际上我在这里找到了。是的,完全正确。是的。
很公平。好的,那么,您认为目前最大的AI趋势是什么?您认为它们在未来一年,也就是2025年将如何发展?
所以我认为最大的发展,我认为有两个方面。一个是大语言模型引擎本身,指的是OpenAI(ChatGPT背后的公司)以及Gemini等类似公司,它们基本上变得越来越直观,越来越强大。你真的达到了一个水平,如果在过去,
他们,你知道,一开始他们受到所基于信息水平的限制。直到一年前左右。今天,所有信息都是最新的。它们真的可以检查一切,并尽可能地帮助你,就像你拥有最丰富的经验一样。
一个人查看互联网并试图搜索东西。所以首先,它们更新得更快。在沟通方式上,它们更直观。它们的能力更强。所以,如果过去只有文本输入,文本输出,今天你可以上传演示文稿,并要求它们从中创建一个博客,反之亦然,或者你可以让它们为你画画等等。
所以这是一个方面。这些大语言模型引擎已经变得更加强大,可以处理文本以外的不同类型的输入和输出。另一方面,有一个完整的行业正在这些引擎之上构建专门的代理,这些代理能够完成各种事情,从
你知道,与文化、艺术、教育、医学、软件相关的事情。例如,我们正在做一些与软件测试相关的事情。所以,这额外的AI代理层
使得大语言模型引擎(AI大脑)的功能更容易用于特定领域,并且在这些领域的应用效率更高。那么这些专业代理是如何工作的呢?你有点像圈地自萌,基本上是各司其职。你给它提供一系列它可以回答的问题或你自己的数据。这是如何工作的?
你可以把它想象成一个专业人士,对吧?所以,如果你去看一位医生,并问他一个关于医学的问题,他能够比一个专门从事医学以外的专业人士给你更准确、更深入的答案。
我不知道,高科技教育或交通等等。所以它非常类似于此。它在一般知识的基础上创造了一种专家水平。它不仅仅是一个聪明的人。它是一个在特定领域具有专业知识的聪明人。我认为这是理解这些建立在大语言模型之上的AI代理的最简单方法。
我明白了。这并不是,那么你,它是为你的公司服务的。所以它拥有一些你之前的专有知识产权,这些知识产权不会反馈回主要ChatGPT系统,对吗?
它是如何工作的?不,我们实际上创建了第一个完全由生成式AI操作的软件测试工程师。你可以把它想象成,在软件测试中,你可以手动测试即将发布的应用程序或网站。
到大众市场,或者你可以创建自动测试它的软件。这样做的原因显然是,当你有非常频繁的发布时,你想快速完成,而不是等待人们手动测试它。所以今天的自动化测试需要程序员,他们可以编写这个自动化测试程序,在你想发布的软件或应用程序上运行。
我们所做的是创建一个AI测试工程师,它能够在没有人为参与的情况下编写这些测试程序。你确实有人在循环中监督这个AI测试工程师的工作。
但是AI测试工程师会收到测试需求,即使用被测网站或应用程序预期会发生什么。然后它会创建能够自动测试该功能的代码。这样做……
大大降低了软件发布到市场的时间成本,因为今天这是软件发布周期中最大的瓶颈之一。谁来测试以及在实际发布给真实用户之前他们能多快完成测试?所以现在有了Blink.io的AI测试工程师,盖娅和我共同创立的公司提供的产品,这个问题已经解决了。
很好。是的,我们过一会儿会更详细地讨论这个。但接下来。所以,虽然AI具有巨大的潜力,但它也有一些缺点。你已经提到了一些。在你看来,AI今天最大的优势和挑战是什么?所以
我认为最大的优势是它真的在快速推进那些需要花费很长时间才能完成的事情。归根结底,AI在某种程度上就像合成的人脑,只是规模巨大,并且它们能够相互连接。所以这不像许多聪明人在一间屋子里。它就像一个超级聪明的人在一间屋子里。所以
AI处理人脑所能做的事情的能力,只是规模更大,连接方式更紧密。
为全人类带来了非常显著的优势。例如,分析大量人群的新药研究结果的能力,剖析信息、理解和归因差异
基于此的不同类型的结果和见解,过去需要或一直在花费,你知道,这可能需要数年时间,因为只有数量有限的专业人员能够做到这一点,他们的时间是有限的。而且你知道,除了工作之外,他们还有其他事情
要做。当你把这项任务交给一支AI代理大军时,他们基本上可以在一夜之间或几个小时内完成。这意味着新药可以更快地发布。这只是一个
对AI带来的优势的高级说明,但你可以在其他许多方面考虑这一点,例如太空研究、任何与采矿相关的事情,以及
将智能或理解融入来自不同领域的巨量数据中,在这些领域,你可能找不到一个拥有所有这些专业知识的人。AI可以拥有跨所有领域的专业知识,
不同的多个学科,并用它来得出结论。所以优势是巨大的。我认为这在很短的时间内为人类带来了巨大的价值。AI的挑战很大程度上在于
可能就像你拥有的任何其他技术一样,你将它用于什么目的?你是否真的将其用于造福人类?一个类似的例子,正如我刚才提到的,或者你实际上将其用于不正当的目的,例如,
你知道,分析和研究人的面部识别以追踪他们的行为和活动。所以很明显,任何技术,就像过去一样,都可以用于好的用途和坏的用途。挑战在于真正地管理生成式AI的使用,使其用于积极的、创造价值的目的,而不是其他目的。嗯哼。
我看到的另一个好处是,像AI这样的东西完全是合成的。它们不是活的。所以它们可以以临床和高效的方式执行任务。它们不必担心,“我的抵押贷款要到期了。”或者“我昨晚睡得很不好。”你知道,“我和妻子吵架了。”你知道,没有什么会打断这个过程。我不知道你对此有什么看法。我只是完全跑题了,真的。是的,很有趣。是的,另一个……
有些人可能对AI,特别是ChatGPT有一些顾虑,如果你在与它交谈,你不应该向它提供个人信息,但人们担心它是否会将这些信息保存在某个地方,将来可能会用来对付你?OpenAI说不会。你认为这存在任何风险吗?或者这只是一个虚张声势?这没什么好担心的,因为你在搜索东西的时候也会和谷歌交谈。
是的,我认为,首先,在OpenAI中,你可以选择是否使用你实际输入的数据。所以这完全取决于你自己的决定。并且有一些不同的计划,它们会使用或不会使用你输入的数据。所以在这种意义上,它是在你的控制之下。
我认为,这与收集个人信息的其它领域类似,你有合规性,
以及其他方法来确保这些数据不会被用于不良或意外目的,例如GDPR或任何此类合规标准,这些标准真正保护你共享的信息仅用于特定目的,或者根本不为任何目的保存和保留。所以
这与今天通过这些合规标准控制的关于我们每个人存储的大量数据非常相似。好的,很好。
这很公平。那么我进入你的产品。Blink.io提供AI驱动的软件测试。那么,AI驱动的测试与传统的manual或自动化测试方法相比如何呢?所以
从本质上讲,我们所做的只是用生成式AI来代替测试人员的人脑。我们创建了这种测试大脑,一种合成测试大脑,它能够完成任何手动测试或测试自动化任务。它能够手动测试网站或应用程序,以应对软件。
某些测试要求,但它也可以为你编写测试自动化代码来自动测试应用程序或网站。这样做的最大优势在于,测试中完成的大部分工作都是非常重复且相当枯燥的。仅仅是维护,不断更新测试自动化代码
以应对应用程序或网站UI中所做的更改是一项非常枯燥的任务。而且大多数人都讨厌做这件事。因此,你不会有很多程序员长期从事测试自动化编码工作。他们通常会来一段时间,然后试图转向产品或研发工程方面。
借助生成式AI,BlinkIO能够创建无限数量的测试自动化编码人员,他们日夜工作,创建和维护这些代码,即使应用程序和网站UI发生了重大更改。
这意味着,如果过去发布软件有时需要几周时间,因为你需要手动测试每个新版本或更新测试自动化代码,这需要相当长的时间,因为你总是缺乏测试自动化人员,
现在所有这些过程都变得无缝,你可以非常快速地创建新软件并发布它。任何东西,从银行应用程序、医疗应用程序、游戏、娱乐、旅游,以及你能想到的任何类型的软件应用程序。非常好。我想它比人工测试人员快得多。
是的。顺便说一句,人并没有被排除在外,循环中有人,但他变成了所有这些为他工作的AI测试工程师的经理。所以在某种程度上,它非常快速地提升了一个人,而不是,你知道,花费数年时间成为测试自动化程序员。
希望成为团队领导,他从第一天起就坐上了这个位置,他监督着10、20个为他工作的AI测试工程师,他批准和审核他们的工作,但他不需要做那些整天追逐应用程序或网站UI变化并根据这些变化更新测试代码的枯燥工作。
我明白了。所以当它进行测试时,它可以边测试边纠正。对吗?完全正确。它会向代码中添加注释,以便其他编码人员可以看到发生了什么吗?是的,差不多。这太好了。那么,BlinkIO的生成式AI如何确保软件质量高于现有解决方案呢?
所以把它想象成一个超级测试自动化工程师。生成式AI不会睡觉,不会休假,也不会犯错。所以我们所做的一件事是,我们消除了之前提到的所有产生幻觉的能力,即梦想一些不存在的东西。你实际上可以校准它,我们将其校准为零。
在某些模型中它被称为温度,在其他模型中则有所不同,但这基本上意味着我们消除了它的想象力,对吧?所以它只基于知识的信息。
行动。但它所做的只是快速地完成人类的工作,而且没有任何错误,无论有多少测试工程师,你都可以随意使用,日夜工作。所以在这种意义上,软件的质量要好得多。你需要理解,今天的软件测试是基于风险评估进行的,这意味着在软件完全发布之前,永远不会对所有软件进行测试。原因是公司根本无法做到这一点。所以他们通常会使用某种风险管理模型来选择测试,比如说,只在iOS或Android设备上测试,或者只用英语或西班牙语测试,或者你会有各种各样的
权衡,只测试修改过的部分,而不测试未修改但可能受到影响的部分等等。实际上,有了生成式AI,你不需要进行所有这些风险评估并采取所有这些步骤
做出明智的风险决定,因为你可以实际测试所有内容。以极低的成本快速进行大规模测试的能力是前所未有的,它带来了高质量的软件。
非常好。从这方面受益最大的领域之一是电脑游戏。有时,我是一个游戏玩家,有时我会在游戏发行时购买新游戏,但它充满了bug。所以像这样的东西,如果他们只是将代码通过这样的东西运行,那在发布之前就很有用。完全正确。你们有来自游戏行业的客户吗?
是的,当然。我们有来自游戏行业的客户,还有来自医疗保健、银行和航空公司等更严肃行业的客户,所有这些不同的公司。归根结底,他们都在做软件。如果你考虑一个游戏应用程序,你需要多少元素?
有多少,你知道,动画评分,所有这些都需要在每次发布新版本时进行测试。这简直是疯狂的。我的意思是,这就是为什么游戏会充满bug或者发布速度很慢。你知道,这基本上是一种权衡。是的,是的,这说得通。好的,那么,您认为公司在采用AI进行软件测试时面临的最大障碍是什么?他们如何克服这些障碍?
我认为,首先,存在一种组织上的挑战,人们非常担心它会取代他们现有的任何角色。我认为,进行公开讨论并向人们展示生成式AI出现后他们的角色是什么非常重要。一旦人们理解了这一点,许多人对将生成式AI整合到组织中的恐惧和抵触情绪基本上就会消除。所以我认为这可能是公司面临的首要挑战。但我认为,如果公司理解在组织中实施AI的战略意义,他们就绝不会不前进并这样做。是的。
例如,在软件测试方面,您是否认为软件工程师职业生涯中的一种职业或垫脚石会过时?或者他们是否总是需要掌握这方面的知识?这就像学习数学,你有一个计算器。你知道我的意思吗?是的。
是的,但是,你知道,当你需要为某些东西计算一些复杂的算法时,计算器是相当无用的。你需要人类的想象力、创造力和判断力。软件测试也不例外。归根结底,你可能花费更少的时间来纠正代码中的语法错误,并试图找到定位器ID来更新已过时的测试自动化代码脚本,但你会投入更多的时间到测试策略中,例如如何测试、测试什么以及多久测试一次,而这些实际上是软件测试中更有趣的部分。我明白了。我认为你提到过你……
基本上,AI已经关闭了它的想象力。那么它是否无法为函数或代码的一部分提供更简化的更正,以便你可以通过这种方式更容易、更快地做到这一点?
这是基于关闭其想象力的能力。如果你想让它做一些像DALI一样的事情,并要求它创作图片和图像并发挥创造力,它将无法工作。但在软件测试这个领域,你最终是在针对明确的要求进行编程,
允许它想象不存在的东西是没有意义的。这将适得其反。它实际上需要测试任何应该存在的东西都存在,而任何不存在的东西。
不存在,你知道,实际上并不需要。所以你不想让它去想象。所以生成式AI在某些情况下具有创造性的能力是一个要求。但在我们软件测试的专业领域,它实际上不仅不是一个要求,而且实际上最好不要有它。这就是为什么我们把它关掉的原因。我明白了。但是,是的,然后由人类
编码人员查看代码并说,好吧,我有这个想法来替换这一部分。我不知道,比如说它将代码减少了80%或类似的东西。然后你的AI可以测试它,并说,哦,是的,它有效,它无效。我说的有道理吗?
是的,不,不。所以,所以当然,我的意思是,生成的VI能够创建创建测试自动化代码的代码。自动测试应用程序或网站的代码是最先进的。我们实际上创建了开源的Playwright代码。所以也没有我们的东西的供应商锁定。这是开源代码,并且知道如何维护它。嗯,所以实际上不需要触摸它创建的代码。嗯,
另一边的程序员,也就是创建被测试应用程序的人,可以随意操作,创建新版本,添加新功能,删除东西。所有这些都将由AI测试工程师无缝地即时测试,这很有趣。
今天这种情况并没有发生,而且在你没有AI的情况下也无法实现,直到程序员或工程师能够实际更改内容并在测试后将其发布到市场上,这需要花费大量时间。所以所有这些部分现在都变得无缝了。明白了。明白了。这说得通。好的,那么。Blink.io是AI驱动软件测试领域的一个相对较新的参与者。是什么启发了它的创立?您在未来五年内如何看待它?
所以整个软件开发、测试、发布、监控领域,所有这些
你知道,我们生活中很大一部分。如果你想想你今天使用软件的程度,你手机上的任何东西,你电脑上的任何东西,你今天在电视上观看的大部分内容,所有这些都是软件,嗯,你知道,汽车由软件运行等等。所以整个软件领域正在由于AI而发生重大变化。借助Copilot,软件开发已经变得非常迅速,它使程序员能够快速创建代码。我认为我们正在关注我们的专业领域,即软件测试,并希望通过AI在这个领域产生巨大影响。这将有点类似于……
今天,我们将与BlinqIO首席执行官Tal Barmeir一起深入探讨AI的未来。从AI驱动的软件测试到工作场所转型以及2025年的预测。这是一集你绝对不容错过的节目!让我们开始吧。另外,别忘了订阅IE+以获取高级见解和独家内容!</context> <raw_text>0 就像Jira和其他项目管理软件对项目管理领域所做的那样,过去你需要有人开会,审核所有任务,然后分配和规划。现在所有这些都在后台无缝进行。像Jira这样的程序正在做这件事。我们相信软件测试也会发生同样的情况。所以不会出现这种瀑布式的
人们等待某人早上来分析哪些测试失败了,哪些测试通过了,然后纠正并将不同的任务分配给研发、DevOps和测试团队来纠正它们。所有这些都将由Generator VI在后台无缝进行。它还将纠正所有错误
对测试端所需的更新,需要提交给研发和DevOps团队的案例,以及环境方面的问题。所有这些都将无缝进行。我们相信这将改变他们的软件发布周期。而我们正处于利用生成式AI进行软件测试这一变革的核心。
太棒了。如果它能让游戏在发布时更可靠,我完全赞成。那么,展望未来,你认为2025年人工智能行业会有什么发展?你认为会出现什么突破或颠覆?
我相信有很多发展正在发生。每隔几个月,就会有一个新的LLM引擎发布。这些引擎变得超级强大和高效。最重要的是,正如我所说,AI代理层正在不断增长。所以我认为会有更多类似于我们在软件测试中使用的专业AI代理,它们将出现在旅游、医疗等各个领域。
所以这是一个即将发生的趋势。另一个趋势是,我认为,对数据的合规性和管理,这些数据在LLM引擎中被聚合,以及对用户提供何种信息的透明度,以及各种可能的问题
AI可能存在的观点并不完全干净,所有这些合规性和透明度规则都将在2025年实施,因为这对该行业持续健康发展至关重要。
明白了。你认为到2025年底DeepSeek会发展到什么程度?说到合规性和信息聚合,这绝对是一个此类担忧出现并需要用户非常清楚地了解实际情况的地方,了解他们输入的信息和问题。
绝对的。绝对的。好的。这就是我所有的问题,Tal。在我们结束之前,你还想补充什么吗?他觉得我们没有触及到一些重要的事情。
我认为今天存在巨大的机遇。我认为实际上在任何领域,不仅仅是在软件测试或编程领域,而且在医疗、法律、行政和运营领域,都应该拥抱生成式AI,因为它将使每个人都能更高效、更有意义、更有价值地为其组织服务。所以我祝我们大家一切顺利,祝大家2025年快乐。
好的,那么,Tel,感谢你的时间。这非常非常有趣。另外,别忘了订阅IE Plus以获取高级见解和独家内容。