·发表于 Towards Data Science ·阅读时间 5 分钟·2024 年 12 月 22 日
--
图片来自 GrumpyBeere 由 Pixabay 提供
我永远不会忘记第一次收到 PagerDuty 警报,提醒我生产环境中的模型评分没有正确返回。
我开始陷入慌乱——我刚刚进行了一次部署,我的脑海中充满了各种问题:
-
我的代码是否引发了一个 bug?
-
错误是否导致了下游的服务中断?
-
代码的哪一部分可能会抛出错误?
调试实时系统非常紧张,我学到了一个关键教训:编写适用于生产环境的代码与在 Jupyter Notebook 中编写能运行的代码完全不同。
2020 年,我从数据分析师转型为机器学习工程师(MLE)。尽管我已经熟练掌握了 SQL 和 Python,但与生产系统的工作让我迫使自己提升技能。
作为一名分析师,我最关心的是我的代码是否能够运行并生成正确的输出。然而,这种心态已经不再适用于成为一名机器学习工程师(MLE)。
作为一名 MLE,我很快意识到,我必须专注于编写高效、简洁且易于维护的代码,这些代码能够在共享的代码库中正常工作。