然而,由于许多企业正利用技术加速数字化转型以改善业务运营状况,数据科学家的工作也变得越来越重要了。超过90%的受访者表示,与疫情爆发前相比,他们工作的重要性维持不变或者有所增加。
为了深入研究数据科学的应用现状,该报告评估了新冠疫情影响、面临的挑战、对分析应用环境的总体满意度,等等。研究表明,疫情颠覆了常规的商业实践,改变了模型和预测算法中的假定和变量,并引起了对流程、实践和操作参数进行相应调整的连锁反应。
超过三分之二的受访者对部署分析项目带来的成果感到满意。然而,42%的数据科学家却不满意其公司对分析和模型的使用,这表明组织并没有很好地基于分析洞察来制定决策。这些42%的受访者表示,业务决策者并未对数据科学成果加以利用,这是其组织面临的主要障碍之一。
该调查还强调了数据科学家在技能水平上存在差异。不到三分之一的受访者称自己在云端管理和数据库管理等方面拥有高级或专家级技能。考虑到自疫情以来云服务的使用显著增多,技能水平的差异确实构成了挑战。94%的受访者表示,他们对云服务的使用有增无减。
“新冠疫情让许多组织加速实施数字化转型项目,这显然对数据科学家提出了更多要求。”SAS英国和爱尔兰数据科学主管Lain Brown博士表示:“组织面临的一个主要障碍是如何执行数据分析的洞察结果,并基于分析结果制定决策,这意味着如果数据科学家在管理层占有一席之地,问题可能会迎刃而解。”
“另外,我们也发现数据科学团队缺乏支持、缺少人才,长期存在供不应求的问题。企业必须认识到,组建一支技能互补的数据科学家团队能为其带来巨大的价值。因此,在逐步转向由AI驱动的、更加数字化的业务流程的过程中,我们要基于投资回报广招人才。”
该研究还发现,不同组织对人工智能伦理道德的重视程度不尽相同。43%的受访者表示,所在组织没有特别审查其分析过程是否存在偏见和歧视,只有26%的受访者的组织将摒除偏见作为模型成功的标准。
当谈到确保公平公正决策所面临的挑战时,行业专家Sally Eaves博士表示:“数据科学家可以利用他们的专业知识制定工作指南,规范数据访问、使用安全和更广泛的事项,例如可持续性、数据伦理和偏见。”
“与其寄希望于获得合适的、干净的数据并过度依赖于技术来产生公平的结果,倒不如数据科学家自身发挥积极作用——制定正确的指导方针、在数据分析的每个阶段进行审核,以尝试消除偏见。关键是要保证从数据到决策的整个流程的透明度和可解释性。”
该研究揭示了疫情的全球爆发也带来了积极的影响。近四分之三 (73%) 的受访者表示,自疫情爆发以来,他们保持了原有的或提高了工作效率,而相似比例 (77%) 的受访者则表示他们与同事的合作有增无减。这表明我们所关注的许多挑战在疫情之前可能就已经广泛存在了。
其他挑战包括数据准备阶段花费时间过长,而模型创建分配时间较少。受访者在收集、探索、管理和清理数据方面所花费的时间高于预期时长(58%)。
“总的来说,疫情背景下突显了数据科学家在组织中扮演着的重要角色,并且这一角色还将变得日益重要,因此他们有充分的理由保持乐观,”Brown表示:“特别是当数据科学家能够利用所有可利用的工具来管理分析生命周期、寻求数据科学培训和发展技能的机会,并将数据准备作为建模的第一步时,他们更能感受到自身被赋予的强大力量。”
完整报告《加速数字化转型》中提供了其他的研究发现和论点,包括可供数据科学家改进流程和结果的策略。
调查方法
2021年,SAS通过多种渠道(包括TechTarget 社区和社交媒体)邀请数据专业人士回答与其工作相关的调查问题。全球共有 277 名数据专员完成了调查问卷。除了这部分量化调查,SAS还对数据专员和专家进行访谈,提出质化问题并收集相关答案。
大多数受访者所在公司规模超过 1000 人,且大多数受访者拥有硕士及以上学历,普通员工和管理层的受访比例大致相同。