可观测性成为ML和LLM应用的最大挑战

 

可观测性成为ML和LLM应用的最大挑战

生产环境 ML 模型面临可观测性挑战!定制工具成主流,仅7%关注ML安全。企业纷纷试水 GenAI 和 LLM,预测分析、计算机视觉应用激增。MLOps、LLMOps、GenAIOps 崛起,LLM 可观测性至关重要!OpenAI、AzureAI、Amazon Bedrock 受青睐。

译自:ML and LLM Adoption Challenged Most Often by Observability[1]

作者:Lawrence E Hecht

在将 ML 模型投入生产时,可观测性和监控是被提及最多的挑战。The Institute for Ethical AI & Machine Learning[2] 在 2024 年第四季度进行了一项关于生产 ML 状态的调查[3]。另一个关键结论是,由于很少有供应商工具获得显著的吸引力,因此定制工具在用户路线图中占据主导地位。

总体而言,在接受调查的 170 名从业者中,44% 是机器学习工程师,与数据科学家或 MLOps 工程师的数量大致相同。许多受访者都是 The ML Engineer newsletter[4] 的订阅者。

只有 7% 的人表示 ML 安全是他们面临的三大挑战之一,只有 17% 的人对治理和领域风险持相同看法。这一发现与我们在其他研究中看到的有显著不同,在其他研究中,安全和 AI 治理被认为是增加采用的最大障碍之一。我们认为,从业者认为 ML 安全仅与模型被黑客攻击的能力有关,而其他 IT 决策者更担心对公司和个人数据的一般访问。

似乎每个企业至少都在试验生成式 AI 和依赖于大型语言模型[5](LLM)的 AI 代理。与此同时,预测分析和计算机视觉的应用持续增长。随着这些应用程序的规模扩大,开发人员需要数据工程师、SRE 和其他人来处理 Day 1 和 Day 2 挑战[6]。为了迎接这一挑战,MLOps[7] 成为了一门真正的学科,随后是 LLMOps 和 GenAIOps[8]

无论使用何种术语,LLM 可观测性和监控[9] 都是必须解决的问题。

定制工具 vs. 供应商工具

该调查询问了利用 AI 和机器学习所需的技术堆栈的九个不同部分。以下是一些值得注意的发现:

  • • 65% 的调查对象使用托管模型或 LLM API 服务。在使用此类服务的用户中,最常使用的是 OpenAI[10](38%)、AzureAI[11](20%) 和 Amazon Bedrock[12](12%)。
  • • MLflow[13] 是领导者。在采用这些工具的用户中,48% 最常使用 MLflow。定制工具 (16%) 和 Weights & Biases (12%) 是该类别中接下来最常用的工具。请注意,刚刚完成 IPO 的 CoreWeave 最近宣布收购 Weights & Biases。
  • • 模型注册表和/或实验跟踪 – 在用户中,40% 最常使用 ETL / 工作流编排器 Airflow[14]。定制工具 (17%) 和 Argo Workflows[15](11%) 是该类别中接下来最常用的工具。
  • • 实时模型服务 – 在用户中,46% 最常使用 FastAPI/Flask Wrapper。数据科学家更倾向于使用此工具 (70%)。定制工具 (16%) 和 AWS SageMaker[16](12%) 是该类别中接下来最常用的工具。

引用链接

[1] ML and LLM Adoption Challenged Most Often by Observability:https://thenewstack.io/ml-and-llm-adoption-challenged-most-often-by-observability/
[2]The Institute for Ethical AI & Machine Learning:https://ethical.institute/index.html
[3]关于生产 ML 状态的调查:https://docs.google.com/forms/u/2/d/e/1FAIpQLSfY7kqfD1YJOW1KwsYr1VYzjn_ONdUVQ71xkgsz2rsulHrJ6Q/viewanalytics
[4]The ML Engineer newsletter:https://www.linkedin.com/newsletters/6882216044568571904/
[5]大型语言模型:https://thenewstack.io/llm/
[6]Day 2 挑战:https://thenewstack.io/cloud-native-day-2-operations-why-this-begins-on-day-0/
[7]MLOps:https://thenewstack.io/what-is-mlops/
[8]GenAIOps:https://thenewstack.io/microsoft-sees-devs-embracing-a-paradigm-shift-to-genaiops/
[9]LLM 可观测性和监控:https://thenewstack.io/what-is-llm-observability-and-monitoring/
[10]OpenAI:https://thenewstack.io/openais-realtime-api-takes-a-bow/
[11]AzureAI:https://azure.microsoft.com/en-us/solutions/ai/
[12]Amazon Bedrock:https://thenewstack.io/amazons-bedrock-can-now-check-ai-for-hallucinations/
[13]MLflow:https://mlflow.org/
[14]Airflow:https://thenewstack.io/how-apache-airflow-better-manages-machine-learning-pipelines/
[15]Argo Workflows:https://argoproj.github.io/workflows/
[16]AWS SageMaker:https://thenewstack.io/address-common-machine-learning-challenges-with-managed-mlflow/

 

前沿技术新闻资讯

刚刚,DeepSeek公布推理时Scaling新论文,R2要来了?

2025-4-7 5:19:59

前沿技术新闻资讯

伯克利最新研究:为什么多 Agent 系统总是“高期待、低表现”?

2025-4-7 7:26:13

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
购物车
优惠劵
搜索