做的人很多真正懂得人很少
登录 | 论坛导航 -> 华新鲜事 -> 心情闲聊 | 本帖共有 4 楼,分 1 页, 当前显示第 1 页 : 本帖树形列表 : 刷新 : 返回上一页
<<始页  [1]  末页>>
作者:孤独的矿工 (等级:2 - 初出茅庐,发帖:197) 发表:2017-09-14 14:53:29  楼主  关注此帖
现在这波machine learning 和data analytics的热潮和20多年前excel 热潮有相似的嘛?突发奇想,觉得现在数据分析的热潮在20多年前也有一波。当时是excel, 职场的人也是一窝蜂的去学excel,更高级的去学vba. 现在这波行情是不是很像,调参数的类比用excel; 做模型的类比学vba. 这样一想,大数据改变社会,也不过是excel 改变社会的一次重现嘛。 --- 该帖荣获当日十大第8,奖励楼主4分以及6华新币,时间:2017-09-13 22:00:03。
做的人很多真正懂得人很少
做的人很多,真正懂的人。会调参数,会推公式有很强的工程能力能够把解决方案落地的更加少。不要觉得跑个模型,整整数据就是Data Science,真正的Data science需要有处理百亿样本、千亿特征的能力,这些东西都不是简单的调包侠就能做的
欢迎来到华新中文网,踊跃发帖是支持我们的最好方法!原文 / 传统版 / WAP版所有回复从这里展开收起列表
作者:孤独的矿工 (等级:2 - 初出茅庐,发帖:197) 发表:2017-09-15 13:43:51  2楼
现在这波machine learning 和data analytics的热潮和20多年前excel 热潮有相似的嘛?突发奇想,觉得现在数据分析的热潮在20多年前也有一波。当时是excel, 职场的人也是一窝蜂的去学excel,更高级的去学vba. 现在这波行情是不是很像,调参数的类比用excel; 做模型的类比学vba. 这样一想,大数据改变社会,也不过是excel 改变社会的一次重现嘛。 --- 该帖荣获当日十大第8,奖励楼主4分以及6华新币,时间:2017-09-13 22:00:03。
你说这个说明你不动DataScience
你用Excel来说Data Science,只能说明你不懂机器学习。
欢迎来到华新中文网,踊跃发帖是支持我们的最好方法!原文 / 传统版 / WAP版所有回复从这里展开收起列表
作者:孤独的矿工 (等级:2 - 初出茅庐,发帖:197) 发表:2017-09-18 10:31:26  3楼
现在这波machine learning 和data analytics的热潮和20多年前excel 热潮有相似的嘛?突发奇想,觉得现在数据分析的热潮在20多年前也有一波。当时是excel, 职场的人也是一窝蜂的去学excel,更高级的去学vba. 现在这波行情是不是很像,调参数的类比用excel; 做模型的类比学vba. 这样一想,大数据改变社会,也不过是excel 改变社会的一次重现嘛。 --- 该帖荣获当日十大第8,奖励楼主4分以及6华新币,时间:2017-09-13 22:00:03。
说一下国内的情况
我在国内的互联网公司工作了4年的时间,一直在做机器学习相关的工作。很抱歉国内做算法的人通常也要有很强的工程落地能力,把算法的模型和改进通过提需求的方式让工程团队实现,本来就很不现实,沟通成本太高。百度之前广告上的深度网络,RNN等模型都是算法团队自己开发和调参的。把机器学习当成简单的调包侠绝对是对这个工种的侮辱
欢迎来到华新中文网,踊跃发帖是支持我们的最好方法!原文 / 传统版 / WAP版所有回复从这里展开收起列表
作者:孤独的矿工 (等级:2 - 初出茅庐,发帖:197) 发表:2017-09-18 14:00:20  4楼
现在这波machine learning 和data analytics的热潮和20多年前excel 热潮有相似的嘛?突发奇想,觉得现在数据分析的热潮在20多年前也有一波。当时是excel, 职场的人也是一窝蜂的去学excel,更高级的去学vba. 现在这波行情是不是很像,调参数的类比用excel; 做模型的类比学vba. 这样一想,大数据改变社会,也不过是excel 改变社会的一次重现嘛。 --- 该帖荣获当日十大第8,奖励楼主4分以及6华新币,时间:2017-09-13 22:00:03。
我因为我说的那个话道歉
我也为我说的那个话表示对不起,我想说的是Excel的入门难度很低,但是真正的Data Science不是这么简简单单就是能上手的。我在百度工作的时候,算法本身其实不是特别复杂。不会用到很深入优化算法。比如当时我参与的DNN项目,源头上还是BP算法,不过在模型的网格设计、Embeding的参数等方面有很多调优上面有很多技巧。同时我们处理的数据是千亿样本百亿特征,在这样的情况下单机是肯定不可能把模型训练出来。。所以需要很多分布式算法的构建,数据的分片、模型的分片。保证不同分片上的全局一致性等问题都要考虑。。。现在ICML,NIP上Google、FB、BAT都发的论文数已经和高校差不多了,原因就是深度学习是一个拼资源、拼工程的玩意。。。。。这块上面企业界要比高校强太多了
欢迎来到华新中文网,踊跃发帖是支持我们的最好方法!原文 / 传统版 / WAP版所有回复从这里展开收起列表
论坛导航 -> 华新鲜事 -> 心情闲聊 | 返回上一页 | 本主题共有 4 篇文章,分 1 页, 当前显示第 1 页 | 回到顶部
<<始页  [1]  末页>>

请登录后回复:帐号   密码