-
AutoML
如何利用技术弥合数据科学人才差距
文/ Sushman Biswas
数据科学家继续成为跨行业组织的难以招聘的雇员。以下是自动化机器学习如何帮助组织克服数据技能短缺并推动业务增长。
随着数字技术不断产生越来越多的数据,组织面临着释放数据价值的挑战。考虑一下:我们当前每天的数据输出大约是2.5千万亿字节或2.5艾字节/天,这可以与人类所说的所有单词的一半进行比较!
难怪数据科学家的需求处于历史最高水平。根据LinkedIn最近的一份报告,仅在美国,组织就面临着数据科学家的大量短缺,超过151,000个数据科学家的工作空缺。急剧的技能差距和更长的填充时间会给企业造成巨大的损失,并阻碍数据分析的部署。
在人工智能(AI)和机器学习等技术对业务成功至关重要的时代,数据分析的价值从未如此强大。
“这场比赛现在正在提升人才。很长一段时间,我们谈到了成为数据驱动以获取竞争优势的必要性。现在,组织在算法经济中竞争。市场领先的组织已经开始利用当前的AI知识差距作为改变游戏规则的能力。今天我们在市场上看到了简单的AI工具,但在理解AI用例,正确准备机器学习数据以及负责任地使用这项技术方面仍然存在巨大的知识差距。技术障碍减少了,但教育障碍却没有。为了向企业提供可持续的、合乎道德的、值得信赖的人工智能,组织确实需要一个人工智能战略来解决优先使用案例,技术架构考虑因素以及道德标准和审核,“高级总监Jen Underwood说道。
公司如何克服数据科学家的短缺?
为了克服这个问题,组织正在转向自动化机器学习(AutoML),以使非数据科学家能够构建更准确的预测模型,并释放稀缺的数据科学人才,专注于更多关键业务计划。
AutoML将传统方法转变为机器学习和数据科学。它使非数据科学家能够理解数据并实现业务目标。AutoML通过对原始数据运行系统处理并选择从数据中提取最相关信息的模型,在现实世界中构建和使用机器学习模型。它还结合了机器学习最佳实践,使整个组织的数据科学更易于访问。
“自动化机器学习并不能取代数据科学家,”Jen说。“它可以将AI的交付范围扩展到组织中更多数据精通的人才。数据科学家时间是一种珍贵,昂贵的商品。一位全球顶级零售商的高管表示最好:“公司不需要他们的数据科学团队擅长数据科学理论; 他们需要他们“无情地实践价值”。
“通过自动执行耗时且重复的任务,数据科学家可以花费更多时间来解决问题,并为业务提供更多价值。“自动化优先”理念提高了工作满意度,保留了顶尖人才,同时使公民数据科学家能够轻松开始使用数据科学项目。“
自动化机器学习使各行各业的组织能够释放机器学习和人工智能的力量,以前只限于拥有大量资源的组织。
部署自动机器学习的数据要求
提出最重要的问题 - 在组织内部署自动化机器学习平台的数据要求是什么?
“与商业智能中使用的第三范式交易或维度模式不同,机器学习需要将数据输入作为行和列的'展平'表,视图或逗号分隔(.csv)平面文件。您的视图需要包含结果指标,目标变量以及输入预测变量。机器学习算法假设每条记录都是独立的,与其他记录无关,“Jen说。“应该在分析粒度级别收集准备好的数据,以便您做出决策。如果将结果合并到现有业务流程或应用程序中,请选择可操作,可理解且有用的粒度。例如,如果您想要进行每日销售预测,则需要输入日期级别的数据,而不是周,月或年。“
大多数组织已经捕获并存储了这些数据。使用像DataRobot这样的平台,企业可以积极利用数据科学自动化来增强和利用他们最需要的人才。
这对人力资源意味着什么?
显然,对数据科学家的需求不会很快降低,但是,通过部署AutoML平台,人力资源可以节省宝贵的时间,以填补入门级数据科学职位,更好地利用组织内现有的数据科学人才。除此之外,随着AI成为人力资源的一个组成部分,AutoML可以使HR功能变得更加独立和数据驱动。
以上为AI翻译,内容仅供参考
原文链接:How to Bridge the Data Science Talent Gap with Technology
扫一扫 加微信
hrtechchina