er… Excel有过热潮?
登录 | 论坛导航 -> 华新鲜事 -> 心情闲聊 | 本帖共有 13 楼,分 1 页, 当前显示第 1 页 : 本帖树形列表 : 刷新 : 返回上一页
<<始页  [1]  末页>>
作者:icky (等级:15 - 最接近神,发帖:7923) 发表:2017-09-13 17:00:13  楼主  关注此帖
现在这波machine learning 和data analytics的热潮和20多年前excel 热潮有相似的嘛?突发奇想,觉得现在数据分析的热潮在20多年前也有一波。当时是excel, 职场的人也是一窝蜂的去学excel,更高级的去学vba. 现在这波行情是不是很像,调参数的类比用excel; 做模型的类比学vba. 这样一想,大数据改变社会,也不过是excel 改变社会的一次重现嘛。 --- 该帖荣获当日十大第8,奖励楼主4分以及6华新币,时间:2017-09-13 22:00:03。
er… Excel有过热潮?
我还以为一般人会拿AI跟big data比
[本文发送自华新手机Wap版]
This page is intentionally left blank
欢迎来到华新中文网,踊跃发帖是支持我们的最好方法!原文 / 传统版 / WAP版所有回复从这里展开收起列表
作者:icky (等级:15 - 最接近神,发帖:7923) 发表:2017-09-13 17:10:35  2楼
不明觉厉所以现在做data science有前途么? 我目前正在搞这个,觉得data science在医疗和金融领域的分析还是有一定作用的。
有啊
data science以后会越来越普及的
[本文发送自华新手机Wap版]
欢迎来到华新中文网,踊跃发帖是支持我们的最好方法!原文 / 传统版 / WAP版所有回复从这里展开收起列表
作者:icky (等级:15 - 最接近神,发帖:7923) 发表:2017-09-13 17:12:13  3楼
下波什么?层主说来听听……
下波搞不好就是阶层固化
我猜的
[本文发送自华新手机Wap版]
欢迎来到华新中文网,踊跃发帖是支持我们的最好方法!原文 / 传统版 / WAP版所有回复从这里展开收起列表
作者:icky (等级:15 - 最接近神,发帖:7923) 发表:2017-09-13 18:30:35  4楼
从excel 被发明前到现在,有一段时间, excel 极大的提升了工作效率。创造了不少需要excel 技能的岗位,也减少了很多人工计算的工作量和岗位。当然现在excel 已经变成每个人的必备技能了。 会不会20年后,data science 和machine learning 也变成了每个人的必备技能。但大部分人使用起来,也就是点几下呢?
同意
[本文发送自华新手机Wap版]
欢迎来到华新中文网,踊跃发帖是支持我们的最好方法!原文 / 传统版 / WAP版所有回复从这里展开收起列表
作者:icky (等级:15 - 最接近神,发帖:7923) 发表:2017-09-13 18:32:50  5楼
从excel 被发明前到现在,有一段时间, excel 极大的提升了工作效率。创造了不少需要excel 技能的岗位,也减少了很多人工计算的工作量和岗位。当然现在excel 已经变成每个人的必备技能了。 会不会20年后,data science 和machine learning 也变成了每个人的必备技能。但大部分人使用起来,也就是点几下呢?
同意楼上
以后的确可能是这样,但是也需要几个懂的人来看机器做的东西对不对

最怕是人以为机器总是对的,或者过度依赖机器

这个在Excel是没有的
[本文发送自华新手机Wap版]
欢迎来到华新中文网,踊跃发帖是支持我们的最好方法!原文 / 传统版 / WAP版所有回复从这里展开收起列表
作者:icky (等级:15 - 最接近神,发帖:7923) 发表:2017-09-13 18:57:30  6楼
只是工具大部分人知道AI的东西怎么用就行了,立足之本还是对每个行业的domain knowledge。
domain knowledge也不一定干得
过机器啊
[本文发送自华新手机Wap版]
欢迎来到华新中文网,踊跃发帖是支持我们的最好方法!原文 / 传统版 / WAP版所有回复从这里展开收起列表
作者:icky (等级:15 - 最接近神,发帖:7923) 发表:2017-09-13 23:08:55  7楼
现在机器这么牛逼了?我咋不知道呢
ML正在一个domain一个domain的搞啊
下围棋的domain knowledge该多吧,也被搞了,而且搞出来人类理解不了的domain knowledge
[本文发送自华新手机Wap版]
欢迎来到华新中文网,踊跃发帖是支持我们的最好方法!原文 / 传统版 / WAP版所有回复从这里展开收起列表
作者:icky (等级:15 - 最接近神,发帖:7923) 发表:2017-09-14 23:59:10  8楼
ML 最有趣的一点是:人觉得很难的任务,机器搞起来不一定难。但人觉得简单的任务,机器搞起来不一定简单。 预测在哪个domain ,机器能干过人类,甚至替代人类,就变成了一个很有意思的问题。您作为从业者,对这个问题有什么看法吗?
我认为现阶段性的AI还只是做,而不会想
machine learning还是task oriented, 现阶段的machine learning是machine completing a task, 而且可能比人类做得好。

而“想”是包含引申,归纳,构造等等,比方说小孩子辨识猫跟狗,肯定不像machine learning需要几千张图片,看几个就知道了。所以现在的AI还没办法做inductive learning,不过我觉得这样也很好,有创造性的东西还是应该留给人类做。
[本文发送自华新手机Wap版]
欢迎来到华新中文网,踊跃发帖是支持我们的最好方法!原文 / 传统版 / WAP版所有回复从这里展开收起列表
作者:icky (等级:15 - 最接近神,发帖:7923) 发表:2017-09-16 12:26:05  9楼
我的确不太懂Data Science,但不妨碍我按我的理解对这个领域进行一点小小的讨论。 如果觉得我水平差,不回我的帖子就行了。不用对我的知识水平做评估。如果想对我的观点进行驳斥,欢迎讨论。如果想人身攻击,欢迎离开。
有人总觉得别人不懂,你懂的。。。
[本文发送自华新手机Wap版]
欢迎来到华新中文网,踊跃发帖是支持我们的最好方法!原文 / 传统版 / WAP版所有回复从这里展开收起列表
作者:icky (等级:15 - 最接近神,发帖:7923) 发表:2017-09-16 12:27:45  10楼
把machine learning跟excel比太不恰当了给人的感觉好像都是做数据分析一样, 不过machine learning里面设计的东西多多了。 很可能是懂理论的工程能力不行, 工程能力可以的理论又不行, 两个都有的可能没有business sense。 不过以后data science说不定会变成咨询行业,分析问题和提出数据驱动的解决方案,然后有专门的工程团队来实施落地。
你说的理论和工程指的是什么
理论是数学,工程指调用各种library跟function?
[本文发送自华新手机Wap版]
欢迎来到华新中文网,踊跃发帖是支持我们的最好方法!原文 / 传统版 / WAP版所有回复从这里展开收起列表
作者:icky (等级:15 - 最接近神,发帖:7923) 发表:2017-09-16 12:38:08  11楼
以后data science肯定不是单机模式的现在自己搞台电脑调个包, 跑跑参数好像就在搞machine learning了。真正到到解决实际问题的时候, 数据量大的时候估计很多人连高效地数据怎么处理都不知道了。工程能力不单指coding, 其他各种分布式系统之类的知识都包括了。 不过以后这两个role说不定会分开, 现在flag就有专门的理论和工程团队, 连国内bat也在赶上
同意
做system optimization跟做model optimization的确是两拨人
[本文发送自华新手机Wap版]
欢迎来到华新中文网,踊跃发帖是支持我们的最好方法!原文 / 传统版 / WAP版所有回复从这里展开收起列表
作者:icky (等级:15 - 最接近神,发帖:7923) 发表:2017-09-18 18:04:27  12楼
我因为我说的那个话道歉我也为我说的那个话表示对不起,我想说的是Excel的入门难度很低,但是真正的Data Science不是这么简简单单就是能上手的。我在百度工作的时候,算法本身其实不是特别复杂。不会用到很深入优化算法。比如当时我参与的DNN项目,源头上还是BP算法,不过在模型的网格设计、Embeding的参数等方面有很多调优上面有很多技巧。同时我们处理的数据是千亿样本百亿特征,在这样的情况下单机是肯定不可能把模型训练出来。。所以需要很多分布式算法的构建,数据的分片、模型的分片。保证不同分片上的全局一致性等问题都要考虑。。。现在ICML,NIP上Google、FB、BAT都发的论文数已经和高校差不多了,原因就是深度学习是一个拼资源、拼工程的玩意。。。。。这块上面企业界要比高校强太多了
现在拿企业跟高校比有点不公平
做这些research最最重要的就是数据,但是高校没有啊!数据都在企业。长远来看,research是搞不下去了,各公司都有自己的系统,也没办法发paper互相交流,能发paper的肯定是过时的技术,所以后面高校、科学院这些地方会慢慢被企业抛弃。
[本文发送自华新手机Wap版]
欢迎来到华新中文网,踊跃发帖是支持我们的最好方法!原文 / 传统版 / WAP版所有回复从这里展开收起列表
作者:icky (等级:15 - 最接近神,发帖:7923) 发表:2017-09-21 23:26:20  13楼
多谢过来人的高质量回帖 正好以前辈的回帖为契机,来表达一下还没表达清楚的观点。顺便小结一下这个帖子。 1) 工业界和学术界在大潮之中的定位 大数据时代,数据成了最重要的资源。学术界没有像工业界那样拥有第一手的数据,表面上看起来,的确处于劣势。但不要忘记,统计这门科学,本来就是在数据稀缺的时代被发明的。统计的本质就是从有限甚至少量的数据中推断出普遍的规律。只要人或者机器不能达到全知全能,统计这门科学就有意义。 而且,machine learning 能够 work 的两个基本前提是数据有代表性和Chebyshev's Inequality。(当然,大部分数据从业者可能认为自己搞出来的东西能 work 的原因是自己吊。)现实中,数据量不满足Chebyshev's Inequality的情况比比皆是。比如说金融数据,数据量不足和heteroskedasticity 给 machine learning 在金融中的应用带来了巨大的挑战。在这种情况下,开发新的,数据需要量小的/收敛速度快的模型就变得非常有必要。而这种活,一般都是学术界干的比较好。 2)数据科学的前景 大部分人都不会否认,数据科学前景巨大。但到底是什么样的前景,有多巨大,每个人可能都有自己的理解。不管怎么理解,祝大家在新的浪潮中弄潮愉快。 (more...)
你是统计出身啊
heteroscedasticity
[本文发送自华新手机Wap版]
欢迎来到华新中文网,踊跃发帖是支持我们的最好方法!原文 / 传统版 / WAP版所有回复从这里展开收起列表
论坛导航 -> 华新鲜事 -> 心情闲聊 | 返回上一页 | 本主题共有 13 篇文章,分 1 页, 当前显示第 1 页 | 回到顶部
<<始页  [1]  末页>>

请登录后回复:帐号   密码