回复作为一个data scientist出来说两句。好的data scientist其实是full stack developer+statistician。需要写的了scripting language(Python, Julia, etc.),玩的了high level language(C/C++),做的了visualization(Javascript..),很强的数学功底(理解各种model的原理),强大的big data skills(MapReduce, Hive,...),以及很好的data sense,更重要的是一个行业的domain knowledge。这需要一个聪明的头脑加长时间的积累。
感觉data scientist是一个被玩坏的词。公司从年初开始招data scientist,面试了很多人,99%都是自称data scientist但是上述几点一个都没有。职位至今仍然空缺。
个人认为一个data scientist需要的skill set可以很好的从Cloudera ccp data scientist cert的考试内容略探一二。有兴趣的同学可以上网搜索一下。
+1
层主说得很对,补充一点,现在big data都转Spark了
[本文发送自华新iOS APP]