这样的一位数据科学家,需要有丰富的经验和过硬的专业知识。只要找对了赞助商,那么这个人肯定就能走上正道,并把整个项目发展起来。
然而,在数据科学计划慢慢成型的过程中,你可能需要一个技术团队来帮助项目进行提升。该团队主要由机器学习工程师、数据科学家、统计学家和软件工程师组成,可能还需要一两个数据分析师。
大公司里的IT技术人员以系统为中心来处理数据,他们一般都拥有许多技能,比如编程、系统开发、系统支持、商业支持以及跨职能团队合作的能力,也正是这些技能使得他们能胜任数据分析师的工作。其中,如果中级开发人员有一定的商业知识背景,还擅长使用各种数据处理工具,那么,他们便是数据分析师很好的人选。
数据分析师是所有专家的中间人
在数据科学团队中,数据分析师能把所有技术专家都协调起来。数据分析师通常能为数据科学家或统计学家指明研究方向,说明哪些假设值得深入研究。他们可以和机器学习工程师及软件开发者合作为机构组织架构和开发全面的数据科学项目,还能通过数据可视化来进行初步分析,开启数据科学的新旅程。
企业中的中级或高级的IT专家大多情况下会与其它部门进行合作。跨职能的团队协作能力再加上软件工程背景便赋予了企业IT人员与其他专家展开良好合作的能力。
数据分析师了解业务情况,对数据有直觉判断
数据分析师或多或少在技术层或者商业层面都有和数据打过交道。通常来说,数据分析师在处理数据的过程中能培养出对业务一定的见解,慢慢地对数据就会有自己的直觉判断。通常,数据分析师如果在接手数据科学项目之前就与公司业务打过交道更具有商业远见。慢慢培养商业直觉,再不断围绕着业务提升这方面能力可以为数据科学项目节约大量时间。
企业中IT技术人员的工作离不开“数据”二字。随着大数据在IT领域的推广,大部分软件开发都围绕数据进行。数据分析师可以通过为企业研究系统解决方案来学习业务知识。解决数据完整性,数据仓储和系统性能等问题以提供系统支持能培养技术专家的数据直觉,还能加深其对数据完整性的理解。
数据分析师拥有可与其他专家匹敌的好奇心以及持续跟进工作的恒心
数据科学是一个迭代的过程。商业分析如同大海捞针,通常需要花几个月的时间研究数据才能找出一个可行方案。这就对数据分析师的恒心以及决不妥协的好奇心提出了要求。
企业的IT技术员整天都会陷入失落情绪中。每天都和系统代码库打交道,难免会觉得多年反复在与同一系统工作,纠缠于办公室斗争以及为海量的数据头疼,无聊至极。而身处如此环境却从不退缩,坚守岗位的工程师,才是数据分析师的最佳人选。
数据分析师掌握了数据存储和检索技术
一般来说,在商业环境下,有很多技术可以用来存储大数据。此外,依靠数据采掘工具的行业在数据处理的过程中就能获得分析结果。熟练掌握数据存储和检索技术的分析师懂得如何快速获取所需的“精炼的”数据集。
为企业工作多年的IT技术专家不仅知道如何对系统进行进一步的发展,还知道怎么存储数据、挖掘数据以及提炼数据。这些技能非常宝贵,能帮助机器学习工程师和数据科学家更加专注于建模和数据科学的工作。
数据分析师是查找数据的能手
数据分析师通常是查找数据的不二人选。他们不仅能整理、清除数据,还能通过数据库找到所需的重要信息,有时甚至凭直觉就能找出最重要的信息。
查找数据的能力是企业IT专家所具备的最重要的能力。处理许多数据库遗留问题,重构经常失控的代码库,优化性能等调试工作都是企业IT人员擅长的。他们拥有跨系统调试技能,可以标记和跟踪数据以找出系统问题。这项技能对数据分析师来说十分重要,他们必须要找对方法来指明项目方向。
数据分析师“心有大局”
数据分析师天生是“心有大局”的人,能游刃有余地与专家一同工作。他们的工作性质就是协调所有人的工作,因此,他们能做到“心有大局”。如果数据分析师的技能可以得到充分利用,那么他们便可以从管理中学习到对业务重要的信息。最终能独立工作并拥有自己的见解。
与科技大厂和初创公司的软件工程师不同,企业IT开发者更注重“大局”,他们不会花大量的时间去抠软件中某一点细节,而是更专注于开发可能在一个或多个系统中多个组件上运行的解决方案。这些企业IT开发人员的开发性也使他们成为了数据分析师最佳人选。
数据分析师掌握了多种编程语言并且拥有处理不同类型数据存储的技术
因为数据分析师必须在数据中穿行,协助清理数据,可视化数据,因此,一名优秀的数据分析师须对R语言或者Python等编程语言、数据可视化概念和实践以及对SQL和NoSQL等数据提取技术非常熟练。通常来说,一名好的数据分析师还应有使用Tableau或者SAS的经验。他们可能不具备算法、统计和分析等经验,但他们肯定曾在技术层面使用过用于编写算法的工具。
企业IT开发者能使用很多不同的编程语言。有5年及以上经验的中高级水平的开发者能在SQL和NoSQL领域熟练地开发系统解决方案。有的甚至还有过C++和Java的经验。对他们来说,处理负责的数据和学习一门新的编程语言不是什么难题。这些开发者对Perl,Awk等脚本语言也非常熟悉。如果没有过python这种以目标为导向的编程经验,要想学习R或Python也是很简单的。
处在机器学习和大数据的时代,人们总是想找一个数据科学项目的“最佳人选”。只要方法得当,企业IT技术人员也能在数据科学领域大展身手。也许我们需要经验丰富的机器学习工程师来扩大数据科学规模,可能还需要数据科学家来带领数据科学团队。但是,企业IT技术人员也是可以依靠的的,他们掌握了一定业务知识,具有敏锐的洞察力。如若他们成为数据分析师,可以在专家团队中架起沟通的桥梁,为数据科学项目传达真正的价值。不要忘了,成功的数据科学项目是一个团队努力的成果。