Skip to content

Latest commit

 

History

History
115 lines (58 loc) · 8.84 KB

data-science-projects-land-job-2022.md

File metadata and controls

115 lines (58 loc) · 8.84 KB

2022 年能让你获得工作的数据科学项目

原文:www.kdnuggets.com/2022/05/data-science-projects-land-job-2022.html

2022 年能让你获得工作的数据科学项目

图片来源:国家癌症研究所Unsplash

正如数据行业的从业者无数次提到的,构建数据科学项目是进入该领域最简单的方法之一,尤其是当你没有硕士学位时。


我们的前三名课程推荐

1. 谷歌网络安全证书 - 快速进入网络安全职业的快车道

2. 谷歌数据分析专业证书 - 提升你的数据分析能力

3. 谷歌 IT 支持专业证书 - 支持你所在组织的 IT 工作


在我 2020 年写的上一篇文章中,我提供了一些数据科学项目的想法,你可以将这些项目添加到你的作品集中,以增加获得工作的机会。距离那时已经过去两年了。

在行业工作了一段时间,与数据科学招聘经理交谈,并审阅了简历后,我对应该添加到简历中的项目类型有了略微不同的看法。

在这篇文章中,我将为你提供有关应添加到你的作品集中的项目类型的建议,包括哪些项目应添加,哪些不应添加。一些项目实际上对你的简历有害,展示这些项目可能会导致你的申请被淘汰。

我还将提供一些项目想法,包括教程和源代码作为参考材料。确保你不要完全照搬这些项目——稍微修改代码并加入你自己的独特创意,最重要的是,确保你理解你在做什么。数据科学面试官几乎总是会要求你解释过去的项目和源代码,如果你不了解自己的工作,将很难通过面试阶段。

你应添加哪些项目到你的作品集中,哪些项目应避免?

:创建能通过数据解决问题的项目

我经常看到人们构建数据科学项目时忽略了最终目标。

我曾经查看过一个候选人的 GitHub 资料,看到数百行 EDA 和五颜六色的图表。它看起来不错,但我不知道他的目标是什么。坦白说,我觉得他自己也不知道,因为他无法准确解释他试图通过分析实现什么。

这个候选人犯了一个常见的错误?—?他过于专注于展示他知道如何构建不同类型的图表、预处理和操控数据。过多关注代码、库和工具,而不是关注从分析中得出实际结果。

大多数招聘经理并不真正关心你使用的库和工具。他们想了解你的思维过程,以及你为什么决定采取这种方法来解决问题。他们想知道你在得出结果的过程中遇到了哪些困难,以及你应用了哪些方法来克服这些困难。

如果你能够带领他们了解整个数据科学项目,并解释你做了什么和为什么这么做,你将给雇主信心,证明你的推理能力。这表明无论你使用什么程序或库,你都能解决出现的任何问题。

不要:创建过度使用的项目

泰坦尼克号生存预测、波士顿房价预测和鸢尾花分类是你不应该在简历中展示的项目。

虽然这些项目是提升你机器学习技能的好方法,但它们太简单且常见,不适合在简历上展示。这些数据科学项目非常流行,其他候选人可能也会在他们的申请中展示这些项目。

如果招聘经理审阅了 50 份简历,而你展示了与 40 个其他候选人相同的项目,你的简历很可能会被丢弃,因为你没有从人群中脱颖而出。

由于这些项目相对简单,雇主可能会觉得你的数据科学知识很浅显,仅停留在表面。

数据科学项目来建立你的作品集

以下是一些能够增强你简历并帮助你在面试中脱颖而出的项目示例:

1. 流失预测

客户流失率是指消费者停止与组织进行业务的比率。高客户流失率对公司不利,如果他们能预测到用户即将停止购买,他们会采取措施防止这种情况发生。

这是数据科学在组织中的最流行应用之一。

如果你在简历中展示一个客户流失预测模型,你将吸引招聘经理的注意,因为这是一个他们熟悉的用例。这帮助你在展示没有实际业务相关性的项目的其他候选人中脱颖而出。

这里有一个我在线找到的教程,你可以跟随它来学习如何预测客户流失。一旦你理解了代码并熟悉流失预测模型的工作原理,我建议从头开始构建你自己的算法。不要在没有充分理解的情况下复制别人的代码,否则你会发现很难通过面试或回答与项目相关的问题。

2. 客户细分

客户细分是将公司的目标受众划分为不同用户组的过程。每个组的模式会相似。

我推荐创建这样的项目,因为它也是组织中常见的数据科学用例,并且能为公司增加商业价值。

你可以跟随我创建的客户细分教程,使用 Kaggle 的 Mall Customer Segmentation dataset 进行编码。我进行了探索性数据分析、预处理,并最终建立了一个模型,将购物中心的客户细分为不同的用户组。我还提供了如何接触这些个人的建议,以及他们可能感兴趣的产品类型。

3. 出租车行程时间预测

共享出行公司如 Uber 经常需要预测出租车到达时间以及车辆到达目的地所需的时间。

这是一个为组织增加价值的机器学习应用,并且在你的简历上看起来很棒。你可以使用 Kaggle 上的 NYC Taxi Trip Duration dataset 来进行这个项目。

这个数据集已经有一些现有的解决方案来预测出租车行程时间,你可以使用 this 代码笔记本作为参考来构建你的模型。

额外的求职数据科学职位技巧

1. 总是优先考虑质量而非数量

在你的简历中,最好有 2 到 3 个完整的端到端项目,而不是 10 个简单的常见项目。招聘经理通常会要求你详细介绍一个完整的数据科学项目以及你是如何实施的。确保这个项目不如《泰坦尼克号》或《虹膜花预测》那样简单。

2. 在简历中包括不同类型的项目

我上面列出的项目主要集中在机器学习上。确保还展示涉及数据收集、预处理和 EDA 的项目,因为许多数据科学职位要求的技能集不仅仅限于模型构建。

3. 具有创造性和原创性

招聘经理每天都会浏览数百份申请。为了真正让自己脱颖而出,你需要具备创造力。展示讲述故事的项目?——一些他们可能以前没有见过的项目。这里有一些我创建的独特作品集项目的示例,它们帮助我获得了第一份数据科学工作。

尝试进入一个全新的领域可能会让人感到不知所措,尤其是当你没有任何正式的培训背景时。然而,借助大量的在线课程、教程和互联网上发布的源代码,你几乎可以学到关于该领域的所有知识,从而获得数据科学职位。

Natassha Selvaraj 是一位自学成才的数据科学家,对写作充满热情。你可以在LinkedIn上与她联系。

更多相关内容