我因为我说的那个话道歉我也为我说的那个话表示对不起,我想说的是Excel的入门难度很低,但是真正的Data Science不是这么简简单单就是能上手的。我在百度工作的时候,算法本身其实不是特别复杂。不会用到很深入优化算法。比如当时我参与的DNN项目,源头上还是BP算法,不过在模型的网格设计、Embeding的参数等方面有很多调优上面有很多技巧。同时我们处理的数据是千亿样本百亿特征,在这样的情况下单机是肯定不可能把模型训练出来。。所以需要很多分布式算法的构建,数据的分片、模型的分片。保证不同分片上的全局一致性等问题都要考虑。。。现在ICML,NIP上Google、FB、BAT都发的论文数已经和高校差不多了,原因就是深度学习是一个拼资源、拼工程的玩意。。。。。这块上面企业界要比高校强太多了
现在拿企业跟高校比有点不公平
做这些research最最重要的就是数据,但是高校没有啊!数据都在企业。长远来看,research是搞不下去了,各公司都有自己的系统,也没办法发paper互相交流,能发paper的肯定是过时的技术,所以后面高校、科学院这些地方会慢慢被企业抛弃。
[本文发送自华新手机Wap版]