在这段对话中,我们与Keymakr和Keylabs.ai的首席执行官兼联合创始人Michael Abramov深入探讨了人工智能、技术创新和数据标注的世界。凭借在研发管理和数据收集方面的经验,Michael成为了一名软件工程师,心中只有一个目标:通过他的工作产生有意义的影响。无论是在农业还是汽车行业,他都肩负着以创造性的方式推动技术进步和突破的使命……Keymakr成立于2015年,旨在满足对基于计算机视觉的人工智能高质量且经济实惠的训练数据需求。现在,他们正在开发标注工具和数据收集技术,以帮助其在计算机视觉领域的合作伙伴和客户创建创新模型。Keylabs是一个最先进的数据标注平台,它使用内置的机器学习和高效的操作管理来增强数据解释。其先进的算法专为获得最佳结果而设计,适用于各种各样的行业,包括医疗、汽车和安全领域。点击播放以了解:计算机视觉中数据标注的含义。如何在AI系统中建立对错的界限。数据投毒的例子及其对AI工具准确性的影响。您可以访问他的LinkedIn与Michael联系!剧集也可在Apple Podcasts上收听:http://apple.co/30PvU9C🛍️本集推荐产品和服务:🧘♀️环保瑜伽垫——防滑设计,舒适度极佳,非常适合您的所有瑜伽或健身课程。👉点击此处获取🍵有机绿茶粉——富含抗氧化剂,这款绿茶粉是您一天中完美的能量补充剂!👉点击此处体验🌿姜黄素胶囊——利用有机姜黄的力量,自然地增强您的免疫系统和关节。👉立即选购💆♂️指压垫和枕头套装——使用这款理疗套装,缓解压力和紧张,促进放松。👉点击此处订购注意:这些是联盟链接。如果您通过这些链接进行购买,我们可能会赚取少量佣金,而不会向您收取额外费用。这有助于支持播客。谢谢!</context> <raw_text>0 忘记常见问题解答吧。常识、普通知识或谷歌搜索。不如听听一位真正天才的建议?任何行业的95%的人员都足够胜任并获得资格和许可。5%的人则会超越自我。他们会变得非常擅长他们所做的事情,但只有0.1%的人……
大家好,我是理查德·雅各布斯,这是“寻找天才”播客。今天我的嘉宾是迈克尔·阿布拉莫夫。他是Keymaker的首席执行官兼联合创始人。
或elab.ai的网站。这是一个数据标注平台,允许人们对数据进行标注和标记。所以我的猜测是,如果你有某人的姓名和电话号码,你也许也能得到他们的电子邮件。或者如果你有姓名和电子邮件,你就能得到他们的电话号码。这就是我对数据标注的所有了解,但我们会深入探讨。所以,欢迎你,迈克尔。感谢你的到来。
嗨,谢谢。感谢你的介绍。是的,告诉我一些关于你的背景信息,然后,你知道的,我们会谈谈公司。比如,背景。我的名字是迈克尔·阿布拉莫夫。我是一名软件工程师。过去五六年,我一直是Keymaker和Keylabs的首席执行官。实际上,这是同在一个屋檐下的两家不同的公司。Keymaker是一家数据标注服务提供商,而Keylabs是一个数据标注平台。是的,我不会说这是关于电子邮件和电话的。它更像是……
我们实际上大量处理计算机视觉。那么,在计算机视觉的意义上,数据标注是什么意思呢?是的,想象一下你驾驶,我不知道,特斯拉或任何其他具有自动驾驶功能的汽车。
一辆具有自动驾驶功能的汽车。这辆车有摄像头或其他传感器,它必须理解它实际看到的东西。比如,路上是不是有人?交通信号灯是红灯还是绿灯?所以摄像头必须识别它。为了识别它,它使用某种人工智能,某种计算机视觉模型,你知道的,它们看到它,并且它们
理解它们所看到的东西。所以在Keymaker,我们准备这些数据,我们实际上获取所有这些图像、视频、照片,无论是什么视觉数据,我们实际上对物体进行标记,以便计算机视觉开发公司可以获取我们的标记,图像上的物体,并可以训练他们的模型,他们可以说,嘿,这是一个行人,或者这是一个,你知道的,一只狗,一只狗,诸如此类。但这比我解释的要复杂得多,是的。是的,作为……
你知道的,在过去的几年里,我手机上的谷歌,你知道的,从照片中,它会向我展示,比如,我的狗随着时间的推移的幻灯片,我拍摄的所有照片,或者我的儿子,或者诸如此类的东西。所以它越来越好了。我明白了。是的,那
那就是我们所做的。我的意思是,我们的训练帮助谷歌和其他公司做到这一点。你如何……是人类在做这件事吗?还是你们有人工智能……是的,就像六年前,当我们开始的时候,只有人类。但现在是混合的。我会告诉不同的公司以不同的方式去做。所以有些公司会做大约90%的自动化,然后是10%的人工审核。我们仍然是老派作风,因为我们的客户对我们提出了非常……
具体的、非常定制化的要求,所以我会说我们做了90%的手工工作和10%的自动化工作,但这主要是一个手工流程,背后有很多技术,因为我们必须为人工标注员提供非常高效的工具,但是是的,这是完成的,我知道你如何识别,我不知道你该怎么称呼这个,但假设你正在尝试识别猫或狗的图片,
我肯定有一些显而易见的简单的,也有一些让人难以决定的,嗯,我不知道。比如,你怎么称呼那些显而易见简单的和困难的呢?你如何知道什么对人工智能来说是困难的?你如何确定它正确和错误的界限?对。这是一个非常好的问题。这就是我们试图与客户一起想出来的。正如你所说,猫或狗很容易识别,或者像汽车或摩托车。这些,我不记得我们上次做这个是什么时候了,因为
因为这些都被我们的客户完全自动化了,然后你知道世界今天可以自动化所有这些简单的、显而易见的物体检测,我们更多地关注的是,你知道的,对图像或视频中发生的事情的更深入的理解,比如行为分析,所以你可以看到一个人拿着刀,那么你的判断是什么?一个人拿着刀切东西,是
你知道的,罪犯。也许是餐馆里的厨师,对吧?所以你不知道。也许是……好吧,也许是厨师拿着刀在公共汽车上的照片,而公共汽车正在经过。甚至不像在厨房里拿着刀的人接触,而是在枪击区域中间的公共汽车上拿着刀的人的照片。好的。是的。是的。所以我们必须考虑……
更大的背景和更小的背景以及正在发生的事情并进行分析。在许多情况下,我们应该分析行为。有时我们应该分析意图。我的意思是,仍然没有行为,但我们知道会有意图。假设你给我看一段视频,一个人走进一家商场,
然后,我会说,两分钟后,这个人做了一些非常危险的事情。我不知道,打人或其他什么。现在,当我们回到两分钟之前的时候,我们可以看到这个人的步态或行为有点咄咄逼人。所以我们可以更精确地判断这一点。我们可以说,是的,我的意思是,他的态度很咄咄逼人,因为我们知道后果,对吧?所以这有点像走向更大的……是的,所以有……
如果你有这个人的之前的图像,你会寻找这些。如果你们有的话,他们的先前行为是什么?他们的当前行为是什么?行为是否改变了它的速度?是的,有很多因素。非常有趣。不仅如此,我们可以……很有趣,因为我现在在CVPR,这是在田纳西州纳什维尔举行的计算机视觉会议。而且我……
我刚遇到一个人,他让我们为他赌场的项目做标注,也就是数据标记。所以,有趣的是,他们想要通过不同的摄像头和不同的时间识别同一个人。所以想象一下,一家赌场可能有大约3000人
大约300到400个摄像头,这是一个中小型赌场。我们必须做的不仅仅是定义这个人,在这种情况下是物体或主体,并定义主体的行为,我们还应该通过所有不同的摄像头关联同一个人,并说,这是我们在另一个摄像头看到的同一个人。
而且甚至可能在不同的时间。所以这不仅仅是,你知道的,两个摄像头同时,可能是他,你知道的,这个人只是四处走动,
而且还有,就像你们一样,你们是混合型的。我相信他们的系统会寻找异常行为。然后有一个阈值。你可以向上或向下设置各种参数的灵敏度,它会被标记,并可能交给人工进行二次审查。你不想太多,也不想太少。所以我想你可能正在平衡所有这些因素。
是的,这是困难的,因为,是的,我的意思是,这是我们客户的头痛问题,而不是我们的。我的意思是,他们开发计算机视觉模型,他们开发模型的结果,你知道的,模型预测的预测。但这很大程度上取决于我们如何做,我们如何
我们为他们做了多好的工作,比如我们为他们做了多精确的工作来提供训练数据集,以便他们可以训练他们的模型。是的,当然。你还有其他例子吗?你知道的,我知道你不想泄露客户的隐私,但是,你知道的,你能说什么吗?比如,你还有什么其他非常有趣的例子?是的,哦,我可以告诉你我最喜欢的例子,它是关于环境的。它不是来自P2P
人们的那种例子。所以它是来自农业的。现在想象一下,你知道世界上最重要的动物是什么吗?比如为了世界能够生存?比如蚯蚓?什么?动物?比如蚯蚓或浮游植物?不。好的,假设是昆虫。是蜜蜂。哦,
哦,蜜蜂。是的,是的。我的意思是蜜蜂。是的,是的。所以如果没有蜜蜂,就不会有植物,因为植物的生长是因为蜜蜂。是的,谢谢你。非常感谢你。是的。现在想象一下,你知道的,当你是农业公司,一家大型农业公司,并且你拥有你自己的田地,无论是什么,我不知道,庄稼或其他什么,并且你有一些疾病或一些杂草或一些有害的虫子,你想……
确定,你要做什么,你会带来大量的化学物质,并将它们分布在田野上,这通常也会杀死所有好的东西。它会杀死蜜蜂,它会杀死其他无害的昆虫,它会严重污染环境等等。所以现在有这项技术,新技术
这是一台大型激光机器。实际上它所做的是,它有摄像头,它在田野上行驶,在田野上行驶,它用摄像头识别,它识别有害的虫子或
杂草,然后用激光烧掉它们,但它并没有真正精确地定位。好的,所以整个其他环境,生活在地面上的动物,蛇、老鼠和蜜蜂以及所有不应该被杀死的动物都没有被杀死。我记得几年前在CES Keto上看到过这个,我当时觉得它很愚蠢,但现在看来它实际上可以工作。
我不知道为什么,我10年前觉得它太疯狂了,但现在不是了。它可能看起来很愚蠢,但在我看来,这是最大的发明之一,也是农业中最重要的技术进步之一,因为你可以拯救许多不同物种的生命,而且你不会污染土地,地面。我认为这不是一个缺陷。
了。我认为这很棒。但我记得看到过类似的东西。是的,这很棒。是的。所以就像你一样,你会烧掉它们的翅膀或其他什么,假设有一种特定的苍蝇会打扰植物,然后它,所以翅膀被烧掉了,它掉到地上,然后就是自然的了。没有化学物质。是的。太酷了。哇。
那么,你必须考虑的一些技术方面是什么?同样,它看起来像上下文、运动模式,我想,形状变化、颜色变化、与之相关的其他物体,也许它与附近其他生物的相互作用。我的意思是,你会使用哪些因素来创建这样的模型?所以,是的,我认为你还有很多其他来自国防的例子,我……
不喜欢谈论。哦,为什么?因为它们真的……听到这些对某些人来说可能是有害的,是的。但是我的意思是……有些什么例子?有很多事情可以揭示隐藏的东西。比如,我想到了,你,比如这个人走在……
公共场所,这个人把枪藏在衣服下面,在T恤下面,甚至在包里,有一些不同的特征可能会暗示我们这个人藏有枪支或某种武器,实际上我们有很多这样的东西来揭示隐藏的,
在许多情况下,会使用更多传感器,温度传感器,有时是X射线,有时是磁传感器等等。它们以某种方式融合在一起工作。
我们收集融合数据,而不仅仅是摄像头数据。我们也试图揭示所有不同种类的事情。所以我认为今天许多初创公司,我们的客户大多是初创公司。即使是企业,也是高通、英特尔或AMD中的某种小型初创公司。它们仍然是初创公司,因为它们某种程度上拥有,你知道的,组合能力。
组合器在他们的公司内部。今天许多初创公司试图处理非显而易见的用例。所以猫和狗是显而易见的,或者像一个人杀死另一个人也是显而易见的,或者像侵略性行为也成为计算机视觉揭示的显而易见的事情。但是现在许多许多初创公司试图关注非显而易见的事情,他们试图关注预防事情
有时预防是这样的,他们可以理解,他们可以在事情发生前几天或几个月就预防。你可以问我怎么做。有一家初创公司专注于通过面部、情绪、手势、行为等来理解人的情绪和心理状态。——你也可以尝试使用红外线来观察血流的变化,哪些部位会变热。
还有,还有,是的。是的,绝对的,还有。以及这个人做了多少,是的,这个人撒谎了多少,或者说了……
他们不应该在不同的地方说。然后他们试图,你知道的,他们试图查明那个人,并说这个人有60%或65%的危险性,你知道的。所以他们试图预测。你还记得那部汤姆·克鲁斯主演的电影吗?我忘了名字了。是的,《少数派报告》。《少数派报告》,是的。所以这不是……
不再是幻想了。我实际上知道有初创公司在做这件事,试图做这件事,试图,你知道的,他们为此筹集资金。我认为预先犯罪的事情很糟糕。我只是,我不知道,我个人不会,我不想被监视。我的意思是,如果你进入一个受控的环境,比如赌场,或者我会玩三张牌,我会放下武器,无论什么,但是……
即使这样,我也被监视无处不在。当然,我同意你的观点。这是一个非常哲学的问题。我认为很多人,我的意思是,我遇到的那些人,有些人说,我不介意。让他们收集我的数据。他们对我无能为力,因为我很干净。我没有做所有……
对的,我没有什么好隐瞒的,诸如此类。但我会告诉他们,嘿,好的,你没有什么好隐瞒的,但想象一下,在10年后或也许在50年后,你的孙子或你的孩子会做一些事情。也许是无意的,但他们会做一些事情。到那时,这项技术将存在于法院或所有这些警察部门、执法部门等等,
他们的行为将被分析,你的行为或你的数据也将被用作他们行为的背景。这是可以做到的,对吧?警察局有这个。他们不会有来自警官的监控,他们会对你进行监控。所以人们会操纵系统,让你感到不安,或者导致你产生你通常不会产生的行为。他们说,“哦,看,他们在出汗”或“他们在撒谎”。
这不是……当人们说,哦,我没有什么好隐瞒的,他们很愚蠢,因为人们可以极度地扭曲这一点来造成很大的伤害。还有一种行为……这里还有另一个风险,许多人没有考虑过,那就是冒充。比如,你知道的,假设我是一个黑客,我是一个社会工程师或其他什么,我想表现得像……我想出于某种原因对你造成一些伤害。或者也许不是伤害,但我想从你那里偷一些东西,我想操纵。现在,我该如何做到这一点?我可以……
我有你的照片。我可以打印你的脸,我可以把它
你知道的,带到不同的地方,我可以在一些摄像头看着我的地方做一些奇怪的事情,甚至在赌场等等。所以我知道我已经注入了,现在我已经将你的脸,你的身份证与某种奇怪的行为注入到系统中。现在,如果我知道这个系统是全球性的,所有这些摄像头,所有这些赌场都在共享这些数据,并且像,你知道的,在一个地方收集它们,在一个地方处理它们,训练一个大型模型,
所以我已经将你的身份与不良行为注入到系统中,而你并没有这样做,你也不知道这件事。之后可能会给你带来一些问题,我可以利用这些问题。我以后可以打电话给你,说,嘿,
我是警察,我知道你做了这个和那个,你会注意到我没有撒谎,因为你已经收到某种法院传票或其他什么了。所以你会和我谈谈。数据投毒怎么样?我听说过这个词。这正是我举的例子。数据投毒是指当
这是其中一个例子。所以数据投毒意味着我会故意将错误的想法,错误的数据放入数据的处理器中。对。所以我们必须理解,如果没有数据的处理器,数据就不重要。所以某个地方的云中有一个大型处理器,或者,你知道的,让我们称之为ChatGPT,让我们称之为处理器或任何其他大型模型。
当你向它提供任何输入时,它会获取输入并学习一些东西。现在,作为一个坏人,你可以提供错误的输入,但这不仅仅是脏话或其他什么。错误的输入可能是一些你为了操纵整个系统而放入的非常聪明的输入。你可以教它成为,我不知道,纳粹,或者拥有某种意识形态。
我们的社会环境不接受的想法。这就是你可以操纵大众的方式,我会这么说。你想让人们投票给某个候选人,并且你有足够的容量来毒害大型模型,所以你可以写很多文章,并创建很多包含某种想法的材料。
同时知道这个模型会处理这个,它会看到有很多内容包含相同的想法,所以它会认为这个想法是正确的。正确的,是的。还有什么,我不知道,还有什么会让它变得困难?所以,是的,正如我所说,数据注入,数据投毒是我们必须努力应对的事情。而且我
我认为世界将面临的另一个大问题是,你知道吗,你听说过“先保存,后使用”的概念吗?是的,好的。哦,你可以,是的,你有时会保存数据数年,然后以后可以使用。是的,所以,这个术语叫做SNUL,像SNUL,S-N-U-L,它指的是,所以我们今天有太多的数据,比如所有这些4K的视频数据,你知道的,它非常庞大,而且没有
我们今天没有足够的处理能力或足够的电力来处理所有这些数据。这非常困难。所以我们选择只处理对我们来说重要或有意义的数据,对吧?我会说,这不到千分之一的数据会被送到处理器。而且并非所有这些数据今天都被处理。我们没有足够的电力。但是什么
但是我们可以做的是,我们可以将所有这些数据保存在某个地方,因为我们确实有,比如说,存储容量。在10年后,在20年后,当硬件……
将会强大得多,而且它每年都在变得强大。你可以看到这一点,你可以看到这一点,你知道的,英伟达做了什么,所有这些大公司创造了什么。你实际上可以获取所有这些存储的数据并重新处理它,并从中提取一些信息。所以假设今天我可能没有足够的数据来冒充,比如
看起来像你,只有一张你的照片或一些,你知道的,你的声音等等,这对我来说还不够,而将这些数据存储五年十年后,我可以,我可以做更多的事情,变得更危险,对吧?对,这说得通,好吧,我的意思是,你也会遇到这个问题,对吧?你不能创建太多数据,你必须对你的所作所为非常精简,你不想扔掉重要的东西,但你不能保留所有东西,是的,我的意思是,即使在即使在一个
帧中,视频帧中,你指定需要查看的重要区域,然后丢弃其余部分?比如,有多少,你知道的,假设它将用于法庭案件,我不知道,你知道的,你保留多少?你扔掉多少?你如何确保你的系统非常精简,这样里面就不会有大量的额外垃圾?是的,我认为我们没有,今天没有这个问题的确切答案。每个人都会在他们的算法中找到
找到答案。有些算法更好,有些算法更差。有些需要更多数据才能得出结论。有些需要较少的数据才能得出结论。我认为今天说还为时尚早,因为所有这些算法,它们的工作并不像100%甚至90%那样好。但在五年后,我相信我们将
处于一个更加危险的世界,我们应该非常谨慎。老实说,我不知道该如何谨慎。所以一些参考,例如,我看到这位女士用大约100个不同的车牌制作了它,自动车牌识别器无法读取它。看起来那里有大约30辆不同的汽车,你知道的,而且它,
它不起作用。她还用人们的局部面孔制作了另一件衣服,面部识别也无法工作。是的。所以它就像一种反监控设备。你们做任何反监控吗?是的,是的。这方面也有很多发展。所以你可以,我看到一些人在打印一些,你知道的,
你知道的,一些图案在T恤上。所以整个监控系统不会把他看作一个人。它只是忽略了他。我的意思是,他走在一群人中。它可以识别所有其他人,除了他,即使他看起来像,你知道的,两只手,两条腿,一个头,一张脸,一切都是……没有什么被隐藏。但由于这个印在他T恤上的图案……
系统无法识别他。所有的事情,随着系统变得越来越聪明,它们都会消失。是的,我认为这不会帮助我们。我们无法隐藏,但我们无法隐藏这项技术。我们正在继续构建它。在我看来,我们唯一能做的就是我们应该……
意识到它的能力,不是今天,而是几年后,我们应该总是想,好吧,今天我放弃了我的声音,我放弃了我的脸,我放弃了我的其他东西,20年后能做什么?法律改变后能做什么?因为今天的法律规定,你知道的,法院不能使用任何这些东西,他们必须,你知道的,看着我,问我问题,在我被指控犯有罪行或其他什么之前与我交谈,但你不知道
50年后会怎样?也许在50年后,你将被人工智能自动判决,甚至都不知道,对吧?所以我们总是必须提前思考,并试图理解那时会发生什么。尝试模拟这种情况。但是所有这些,我会告诉你另一件事。所有这些公司,所有这些初创公司,所有这些人,他们目前并不关心。他们是,你知道的,我们是工程师,我们是科学家,
科学家,我们只是,我们最大的目标是提出一些东西,你知道的,发明一些东西,找到一些公式,解决一些问题。我们不介意它将如何被使用。就像奥本海默,他知道他在做什么,我的意思是,在某些时候他知道他在制造原子弹,其他人也知道,在他之前,他们知道,你知道的,你可能会产生一些会摧毁很多东西的反应。但他们有点,他们说,好吧,如果我不发明它,其他人也会发明它。
我为什么要停下来?这是我的自我。这是我想获得的宣传,当我发明这个伟大的东西的时候。今天初创公司和公司也是如此。他们不想过多地考虑它可能会被带到坏的地方。他们只想开发新技术,在我看来,这是令人惊叹的。好吧,我的意思是,这是短暂的、沉默的和愚蠢的。是的。
我的意思是,人们很难被,你知道的,摧毁。所以我们必须以某种方式与我们自己的技术作斗争,并以某种方式确保它们不会摧毁我们。这是一个特性。但我相信我们会以某种方式生存下来。好吧。那么,人们找到更多信息和后续行动的最佳方式是什么?他们可以在哪里找到更多关于你公司的信息?哦,是关于公司的吗?是的。我只是想……我们,你知道的,时间快到了。所以我想再次了解……所以如果……
如果你想了解我们的公司,请访问我们的网站。是的,我的意思是,Killops AI或Keymaker.com。我们做数据标注,我们做标记,我们训练,我们帮助训练模型,计算机视觉模型,LLM,比如大型语言模型,所有的一切。所以,我不知道,在LinkedIn上联系我。好吧,我确实想问你一些事情。我们一直在问所有人工智能受访者,在过去几年中发生了什么变化
突然允许LLM工作并允许机器视觉起飞等等。人工智能似乎已经存在很长时间了,但现在突然之间它变得好多了。所以是计算能力更强了吗?是层数更多了吗?是什么?你知道的,我认为所有答案都是正确的,但我有一个答案比其他答案更正确。这是民主化。我们实现了民主化。我们把它给了人们。
好的,我们把它给了每个人,人们是惊人的。人们很聪明。即使那些不是博士的人,即使那些,我的意思是,你不必成为超级聪明的天才教授或诺贝尔奖科学家才能,你知道的,想出一个好主意。目前,人工智能已经民主化,每个人都可以访问它,每个人都可以做他们喜欢的事情。
你知道,他们的想法,比如实施他们的想法,我认为这是人工智能最大的繁荣。这是最大的爆炸。这是人工智能爆炸的最大原因。是的。是的,就像3D打印,你会制作各种模型。是的,这是有道理的。一切。就像工业革命一样。当每个人都能接触到它时,它就爆炸了。因为工业革命,你知道,它在爆炸之前就开始了数十年,我的意思是爆炸。是的。
明白了,没错。互联网也是如此。一旦它被民主化,你知道,它就有了其他的颜色和其他,你知道,分销水平。很好。迈克尔,谢谢你来到播客。这很有趣。当我提到电子邮件时,我明白你为什么笑了。我当时想到的是最低级别的的数据标注。但是,你知道,现在这是一个完全不同的世界了。是的。很好。是的。
如果您喜欢这个播客,请点击说明中的链接,在iTunes上订阅并评价我们。您一直在收听Richard Jacobs主持的《寻找天才》播客。如果您喜欢听到的内容,请务必在iTunes或您收听播客的任何地方评价和订阅《寻找天才》播客。想要比其他人更聪明吗?在FindingGeniusPodcast.com成为高级会员。
本播客仅供信息参考。没有提供任何建议。由于收听而采取或不采取的任何行动均由您自行负责。需要建议时,请咨询专业人士。