欢迎来到AI Unraveled的新深度探讨。这是由Etienne Newman创建和制作的播客,他是来自加拿大的高级工程师和
充满激情的足球爸爸。大家好。如果您觉得这些深度探讨很有用,请花一点时间点赞和订阅。这真的能帮助我们接触到更多像您一样的听众。真的。所以今天我们要深入探讨Google Cloud专业机器学习工程师认证,特别是展望2025年。没错。我们的主要资料来源是Etienne Newman优秀的电子书《Google机器学习工程师考试,2025版》。
顺便说一句,它既有电子书,也有有声书组合,可以在Jamgia Tech和Google Play上找到。我们会把链接放在节目说明中供您参考。一定要看看。现在,这个PMLE认证……
不仅仅是一张证书,对吧?它是一个真正的信号,不是吗?它表明您可以实际应用Google Cloud上的机器学习来解决实际问题。没错。它弥合了仅仅了解理论和实际实施AI解决方案之间的差距。对于正在收听的您,我们的学习者角色,如果您想快速获得关键信息,但又不遗漏重要内容。
那么,这次深度探讨应该是一个不错的捷径,希望沿途能有一些有趣的见解。是的。真正引人注目的是为什么这项认证现在如此重要。我的意思是,我们都知道Google Cloud非常庞大。对。顶级提供商。但对AI和ML技能的需求却激增。我们最近谈论的是相关职位发布增加了100%以上。100%。是的。而2025年对机器学习工程师的预测令人难以置信。
非常强劲。公司不仅仅是在谈论AI。他们正在积极招聘人员来构建它。这正是认证发挥作用的地方。它就像一个徽章,告诉雇主,“好的,这个人了解GCP。他们可以在这里构建和部署ML。”完全正确。我认为这里变得非常有趣。2025年更新,大约在2024年10月开始生效,
它真正地关注了行业的走向。哦,绝对的。非常关注信封。是的,你知道的,管理生产中ML的整个工程方面。当然还有生成式AI。现在无法逃避生成式AI。而Etienne的书,《掌握Google机器学习工程师考试》……
2025版真正深入探讨了这些更新,这非常有帮助。这种关注至关重要。想想看。公司需要能够处理训练这些大型语言模型的工程师,使AI系统高效运行,处理伦理问题。所有实际的东西。所有实际的、复杂的东西。而更新后的考试
涵盖了这一点。因此,对于您这位听众来说,了解这个更新后的证书,也许可以使用像Etienne的书这样的资源,这会让您处于非常有利的地位。好的,让我们分解一下考试本身。它涵盖的主要领域是什么?我要说主要领域。对。
有六个关键领域,我认为它们的结构非常合乎逻辑。它们几乎遵循从头到尾成熟的MLOs生命周期。不仅仅是模型构建。绝对不仅仅是模型构建。权重也说明了一个问题。看看服务和陈旧的模型。大约占20%。而自动化和编排ML管道则更多,约占22%。22%。很多。
是的。它显示了行业对ML工程师管理整个生产生命周期的关注,以及Google的关注。构建模型是一回事。可靠地大规模运行它们是另一回事。这完全说得通。你构建了一些很酷的东西,但是你能让它为数百万用户工作而不会崩溃吗?没错。而Etienne的书非常强调这些领域,因为它们的权重很高。好的。其他领域呢?我假设仍然很重要。哦,当然。
您有构建低代码AI解决方案的架构。大约占13%。这涵盖了像BigQuery ML这样的工具,
使用SQL构建模型。如果您的数据已经存在,那就很方便。非常方便。此外,使用预构建的API,来自模型库的基础模型,文档AI,以及用于农业应用的Vertex AI代理构建器,当然还有AutoML。对,更快的开发选项。然后是关于在团队内部和团队之间进行协作的领域,这突出了ML通常不是一项单人工作。说得对。团队合作成就梦想,即使在AI领域也是如此。是的。然后是将原型扩展到ML模型,约占18%。
这完全是关于使原型达到生产就绪状态的工程严谨性。评估生成式AI解决方案也包含在此处,这是新的且重要的。好的。最后一个。监控AI解决方案约占13%。至关重要的内容。观察数据漂移、概念漂移、模型性能问题、负责任的AI考虑因素、安全问题。
保持系统健康。因此,它确实涵盖了整个生命周期。而Etienne的书详细介绍了所有这些。是的,它用示例和练习题全面涵盖了每个领域,以巩固理解。对。那么考试本身呢,实际考试是什么样的?好的,从格式上来说,它主要是多项选择题和多选题。多选题会让人措手不及。你必须选择所有正确的答案,而不仅仅是一个。棘手。你得到了多长时间?两个小时。120分钟。
大约50个问题。所以是的,平均每个问题只有两分多钟。你需要继续前进。因此,节奏是关键。绝对的。同样,练习格式,也许使用Etienne的《掌握Google机器学习工程师考试》一书中的问题,这对于掌握时间安排非常有帮助。及格分数,知道吗?Google没有公布确切的分数,但普遍认为大约是70%。但说实话,你应该争取更高。给自己留一些余地。说得通。以及后勤、语言、成本。目前只有英语。
标准成本为200美元。一旦你通过,你就可以获得两年的认证。
然后你需要重新认证以保持最新。两年。好的。你如何实际预订?您通过名为Web Assessor的系统注册。您有两种选择来参加考试。远程监考。在家。是的,在家或办公室。但是您需要满足他们的技术设置规则。特定的软件、稳定的互联网,诸如此类的事情。或者您可以去官方的Criterion测试中心。好的。关于准备格式的最佳技巧?绝对的。
绝对的。使用Google提供的官方示例问题。它们让您对问题的风格有最好的感觉。正如前面提到的,Etienne的书包含一个完整的练习考试,这对于模拟真实情况非常宝贵。很好的建议。现在我们多次提到了Vertex AI。它显然是核心,但PMLE角色不仅仅是Vertex AI,对吧?它使用其他GCP服务。哦,绝对不是。Vertex AI可能是主要的平台,工作台,
但是您需要一整套其他gcp服务才能构建一个合适的ml解决方案好的,让我们来分解一下,哪些是关键的?好吧,我们提到了BigQuery ML,使用SQL和BigQuery构建模型非常有用,然后是云存储,用于存储几乎所有东西,数据模型日志,几乎所有东西,是的,可扩展的持久性对象存储
然后,为了处理这些数据,特别是大量数据,您有数据流。用于ETL管道之类的东西?没错。流式和批量处理。对于较小的事件驱动任务,例如在新的数据落地时触发某些操作,云函数是您的无服务器选项。对。轻量级计算。而且您绝对需要云日志记录和云监控。集中式日志、性能仪表板、警报……
对运营至关重要。说得通。还有什么突出的吗?是的,还有几个。为了直接使用预训练模型,您可以使用诸如Cloud Natural Language API或Document AI API之类的工具。因此,您不必从头开始构建所有内容。正确。PubSub是异步消息传递的关键,非常适合流式数据管道。Artifact Registry是您存储容器映像和软件包的地方,这对CICD至关重要。CICD。因此Cloud Build也适合在这里使用。没错。Cloud Build是Google托管的CICD服务。
您可以使用它来自动化构建、测试和部署您的ML工作流程。了解所有这些部分如何协同工作是PMLE角色的核心。您猜对了,它在《掌握Google机器学习工程师考试2025版》中得到了很好的介绍。它确实是一个生态系统。好的,让我们稍微改变一下方向。基础ML概念。GCP上的监督学习和无监督学习。你能给我们快速回顾一下吗?
当然。因此,监督学习,您用标记数据训练模型。您有输入,并且有已知的正确输出或答案。就像通过示例进行教学。完全正确。模型学习映射。常见的任务是分类,预测类别,例如电子邮件中的垃圾邮件或非垃圾邮件,或识别图像中的对象。好的。以及回归,预测连续值,例如预测销售额或估算房价。GCP如何支持监督学习?
有几种方法。Vertex AI AutoML非常适合快速开发,代码最少。Vertex AI自定义训练让您可以完全控制。带上您自己的TensorFlow、PyTorch代码,任何代码都可以。BigQuery ML允许您直接使用SQL训练模型。对,以及评估这些模型。关键指标。对于分类,例如准确性、精确度、召回率、F1分数,查看混淆矩阵。对于回归,均方误差、MSE、平均绝对误差、MAE、R平方。
Etienne的书清楚地解释了这些。明白了。而无监督学习,那里没有标签。正确。无监督学习是关于在未标记数据中查找模式,发现结构,两种主要类型是聚类。将相似的事物组合在一起。完全正确。对相似数据点进行分组。以及降维,通过减少特征数量来简化数据,同时保留重要信息。GCP是如何做到这一点的?对于聚类,您可以使用Vertex AI的内置功能或BigQuery ML。
对于降维,诸如自动编码器之类的技术可在BigQuery ML中使用,或者您可以使用Vertex AI自定义训练来实现各种方法。因此,了解何时使用监督学习与无监督学习,以及如何使用GCP工具进行每种学习,对于考试来说非常重要。绝对是基础。这是一个核心期望。同样,Etienne的书在这里提供了良好的指导和示例。好的,转向更复杂的内容。
深度学习和这波生成式AI,GCP是如何融入其中的?深度学习,使用那些多层神经网络,已经改变了游戏规则,特别是对于视觉和语言任务。CNN和RNN。是的。卷积神经网络CNN非常适合图像分类、目标检测。循环神经网络RNN传统上用于序列,例如文本或时间序列。但是转换器接管了语言,对吧?它们确实如此。
转换器及其自注意力机制在理解上下文和序列方面非常出色。这导致了像Google的PERT这样的模型,非常适合理解。理解含义。对。以及像OpenAI的GPT这样的瓶颈,以生成文本而闻名。您可以在GCP上使用这些强大的模型吗?哦,是的。
Vertex AI模型库是您可以去的地方。它有很多预训练模型,包括Google自己的强大模型,如Gemini,以及许多流行的开源模型。因此,您可以从已经训练好的模型开始。完全正确。直接使用它们,或者使用Vertex AI自定义训练对它们进行微调,以提高您任务的性能。这
这让我们想到了生成式AI,创造新的东西。对。创建文本、图像、代码。每个人都在谈论的一种关键技术是R-BRADE检索增强生成。R-BRADE。好的。它基本上是如何工作的?您获取自己的文档或数据,将其分解,将其转换为称为嵌入的数值表示。使用诸如Vertex AI向量搜索之类的工具。完全正确。您索引这些嵌入,当用户提出问题时,您可以根据嵌入检索最相关的部分数据。
然后,您将检索到的上下文与原始问题一起提供给大型语言模型。啊,所以模型的答案以您的特定信息为基础。完全正确。它使答案更准确,更符合您的上下文。Vertex AI代理构建器是一个非常强大的工具,旨在帮助您更轻松地构建这些RH应用程序。微调也是一种选择。是的。微调是关于获取基础模型并使用您自己的标记数据集对其进行进一步训练,以使其专门用于特定任务。
因此,能够使用、自定义、也许微调,并且肯定使用像Vertex AI上的RG这样的工具来支持这些基础模型,这对于2025年的PMLE至关重要。绝对至关重要。这是一个主要焦点。而Etienne在2025版电子书中广泛介绍了这些生成式AI方面,包括RG和使用Vertex AI进行微调。
说得通。感觉我们一直在回到这个想法,即让ML在现实世界中可靠地工作,这又让我们回到了MLOps。GCP如何实现可靠的MLOps实践?MLOps实际上是关于将ML开发与IT运营相结合,应用那些强大的Inox原则,自动化、CICD监控到整个ML生命周期。使其可靠且高效。完全正确。
关键思想是自动化您可以自动化的所有内容。随着新数据的到来,持续训练模型。使用持续集成和持续交付部署来实现平滑更新。对所有内容进行版本控制,您的代码、您的数据、您的模型。Vertex AI模型注册表在这里有所帮助,对吧?非常重要。用于跟踪模型版本、参数、指标。
此外,使用Vertex AI模型监控进行持续监控对于捕获诸如漂移或性能下降等问题至关重要,此外还可以促进协作并确保可重复性。以及GCP上用于编排此操作的工具。Vertex AI管道是核心。它允许您定义和运行端到端ML工作流程,支持Kubeflow管道和TFX等框架。对于CICD部分,构建和部署。您利用云构建和工件注册表。
典型的流程是代码更改触发云构建,它构建、测试,并可能创建容器映像。该映像被推送到Artifact Registry。然后这可以触发Vertex AI管道来部署新模型或重新训练。因此这是一个自动化的流程。这是目标。对于监控,Vertex AI监控会观察训练服务偏差,即训练数据和实时数据以及预测漂移之间的差异。
Vertex AI模型注册表有助于管理您所有已部署的模型。了解GCP上的这个MLOps工具对于PMLE来说是不可谈判的。Etan的书提供了实际演练。好的,这非常有帮助。让我们谈谈学习策略。如果正在收听的某人正在争取获得证书,他们应该如何准备?首先,制定计划。一个现实的学习时间表,带有里程碑。然后,真正依靠官方的Google Cloud资源。例如考试指南?绝对是考试指南。它会告诉你涵盖的内容。
Google Cloud Skills Boost拥有针对ML工程师角色的优秀学习路径和实践实验室。不要忘记用于深入研究的官方文档以及我们提到的那些官方示例问题。其他平台呢,Coursera、Udemy?这将非常有用,绝对的。
Coursera、Udacity、Udemy上有很多优秀的课程。只是要小心。确保内容对于2025年考试目标是最新的。检查它是否正确涵盖了MLOs和生成式AI。说得对。事情变化很快。确实如此。不要低估社区。Google Cloud社区论坛、Reddit小组、博客。您可以获得实用技巧并了解Google解决问题的方法。
当然,还有像《掌握Google机器学习工程师考试》这样的专用资源。是的。2025版专门针对考试将所有内容整合在一起。以及实践。似乎是必不可少的。不可谈判的。你必须构建东西。选择与考试领域相关的项目,图像分类,也许是一些预测,情感分析。尝试构建一个简单的REG系统。使用表格数据。实际上,在Vertex AI上实现它们。是的。设置一个项目。准备数据。
训练模型,评估它,部署它,
它,部署它,构建管道,也许将CI/CD与Cloud Build连接起来,设置监控,记录它,将其放入投资组合中。以及模拟考试。至关重要。使用官方样本,在Udemy等地方寻找练习测试,并一定要使用Etienne书中的练习考试。它们可以帮助您发现薄弱环节,习惯于问题类型,管理时间并建立信心。你应该如何使用它们?尝试模拟考试条件。计时。对。之后,不要只看分数,分析你为什么答错了问题。
在你的学习中针对那些薄弱领域。很好的建议。关于考试当天本身的任何最终技巧?是的,有一个清单。特别是如果远程测试,事先检查您的设置。如果是在现场,要知道你去哪里。在考试期间,仔细阅读问题,注意那些多选题,使用排除法,尝试以Google的方式思考,可扩展的,首先管理服务,
并且尽量保持冷静和专注。优秀的策略。因此,总结这部分内容,Google Cloud PMLE证书显然很有价值。它表明您拥有在GCP上应用ML的实践技能,而2025年更新真正关注MLOps、生成式AI和负责任的AI,反映了实际的行业需求。对。准备工作需要有策略,包括官方资源、实践项目、模拟考试。
而像Etienne的书这样的资源可以真正指导这个过程。最后,获得认证很好,但持续学习和社区参与是这个领域长期职业成功的关键。说得对。这可能导致您这位听众的最终想法。鉴于AI和云技术发展如此之快,
在听到所有这些之后,您个人在MLOs中,或者也许是在GCP上的生成式AI中,最想进一步探索哪个特定领域?一些需要思考的事情。如果您觉得这个概述很有帮助,并且确实想更深入地准备Google机器学习工程师考试。一定要看看这本书。
是的,请记住查看Etienne Newman撰写的《掌握Google机器学习工程师考试2025版》。它可以作为电子书或有声书组合在GemGatTech和Google Play上获得。链接如往常一样在节目说明中。这次深度探讨只是让您了解了内部内容。确实如此。所以在我们下次在AI Unraveled进行深度探讨之前,请继续探索。