原文:
www.kdnuggets.com/2021/06/shortage-data-science-jobs-5-years.html
评论
由Pranjal Saxena,数据科学家,人工智能顶级作者
照片来源:Andrea Piacquadio 来自 Pexels
1. 谷歌网络安全证书 - 快速进入网络安全职业
2. 谷歌数据分析专业证书 - 提升你的数据分析技能
3. 谷歌 IT 支持专业证书 - 支持你所在组织的 IT 工作
我在数据科学领域已经待了半个十年,自从 Python 编程开始流行。在 2016 年,那时神经网络和深度学习还只是一些流行词汇。那时,谷歌自动驾驶汽车和强化学习引起了轰动。但大多数数据科学爱好者甚至对神经网络的工作原理一无所知。
到了 2021 年,大多数公司都在采用数据科学策略,通过自动化不同的场景来提高收入,并用一个数据科学家取代数十个 IT 人员,这个数据科学家可以利用各种自动化工具如 BluePrism、UI Path、Python 和机器学习算法来完成这些 IT 人员的任务。
这就是为什么我们大多数人都在努力学习 Python、机器学习、分析、深度学习。为什么?因为数据科学家在行业中的价值极高。而且,人们在数据科学领域的薪资也在大幅上涨。
但是,你知道在今天,这些“自动化任务正在通过另一种自动化策略进行自动化”吗?整个数据科学流程正通过单一工具进行自动化。
在 2019 年,数据科学家需要花费数天时间进行数据收集、数据清理、特征选择,但现在市场上已有许多工具可以在几分钟内完成这些任务。
另一方面,我们尝试了不同的机器学习库,如逻辑回归、随机森林、提升机器、朴素贝叶斯及其他数据科学库,以找到更好的模型。
但是,今天,我们有像 H2O、PyCaret 和许多其他云服务提供商这样的工具,它们可以在相同的数据上使用其他 30 到 50 个机器学习库的组合来进行相同的模型选择,从而为你的数据提供最优的机器学习算法,并且误差最小。
事情现在正以快速的速度变化。而且,我们的价值正在以某种方式下降,因为每个人都将信任那些尝试超过二十种机器学习算法的工具,而不是我们这样只尝试了几个机器学习库以获得较低准确率的人。
到目前为止,我们讨论了某些自动化工具在机器学习领域的表现情况。这些工具表现得比我们更好,因为我们使用了有限的机器学习算法知识。而这些工具通过自动化整个 EDA 过程,结合多个库来获得更高效的结果,在更短的时间内提供最佳结果。
但对于深度学习领域,我们的掌握程度不如机器学习领域,并且处理能力有限。市场上也有很多工具,这些工具在拥有最佳处理器方面投入了大量资金。
深度学习涉及更多的数据、处理能力和复杂的神经网络,需要更多的处理能力来提供更准确的结果。
当我们谈论深度学习时,它以处理非结构化数据而闻名。而且,我们 95%的时间是在这里处理图像和测试数据。目标检测、图像分割、构建聊天机器人、情感分析、文档相似性是著名的应用场景。
但是,处理这些应用场景需要了解不同的深度学习算法,如卷积神经网络、递归神经网络、U-Net、沙漏网络、YOLO 等,这些模型需要大量的处理能力来处理更多数据,以提高准确性。
关键在于,今天是 2021 年,公司正在投入大量资金来自动化这些完整的流程。而我们却忙于理解基础的机器学习和深度学习模型,尽管我们没有投资者,无法负担高端机器。
每家公司都意识到这一点,因此五年后,当这些云启用的数据科学工具变得更加高效,并且能够在更短的时间内提供更好的准确性时,为什么公司还会投资于雇佣我们,而不是购买这些工具的订阅呢?
当所有这些事情都将自动化时,你可能会思考数据科学爱好者的未来。是否会出现工作短缺,还是招聘人数会减少?
好吧,当我们换个角度思考时,事情会变得更容易。确实,公司将继续关注机器学习的自动化工作流程。但请记住,没有公司希望依赖另一家公司来完成他们的工作。
每家公司都旨在构建自己的产品,以便不依赖于他人,能够建立自己的自动化系统,然后在市场上销售以赚取更多的收入。所以,是的,确实需要能够帮助行业建立自动化系统的数据科学家,这些系统可以自动化机器学习和深度学习的任务。
最后,我们可以说数据科学家的角色将是通过优化结果来自动化管道。因此,最终我们将自动化机器学习工作流的管道,让自动化决定数据中最佳的特征,并使用精心挑选的算法得出最佳结果。
我们已经看到,由于公司将采用自动化的数据科学管道,未来五年将缺乏数据科学工作。但与此同时,也会对能够自动化数据科学管道的数据科学家有很高的需求。
根据我的想法,要自动化这些管道,我们首先需要了解机器学习算法,以建立更好的自动化系统,这最终将带来更多的就业机会。
那么,你有什么想法呢?我很想听听你的意见。希望你喜欢这篇文章。请继续关注更多相关的文章。我发布关于实时数据科学场景及其用例的文章。
感谢阅读!
提升 Python 编程技能的实用功能
你不需要导入 TensorFlow 就能打印“hello world”
觉得这个故事有趣吗?在 Medium 上关注我 (Pranjal)。如果你想私下联系我,请通过Linkedin与我连接。如果你想直接在邮箱中获取更多关于数据科学和技术的精彩文章,可以订阅我的免费新闻通讯:Pranjal’s Newsletter。
原文。经授权转载。
相关内容:
-
数据科学家、数据工程师及其他数据职业解析
-
如何成为数据科学家的指南(逐步方法)
-
这些软技能可能决定你的数据科学职业成败