现在这波machine learning 和data analytics的热潮和20多年前excel 热潮有相似的嘛?
登录 | 论坛导航 -> 华新鲜事 -> 心情闲聊 | 本帖共有 55 楼,当前显示第 52 楼 : 从楼主开始阅读 : 本帖树形列表 : 返回上一页
作者:icky (等级:15 - 最接近神,发帖:7923) 发表:2017-09-21 23:26:20  52楼 
多谢过来人的高质量回帖 正好以前辈的回帖为契机,来表达一下还没表达清楚的观点。顺便小结一下这个帖子。 1) 工业界和学术界在大潮之中的定位 大数据时代,数据成了最重要的资源。学术界没有像工业界那样拥有第一手的数据,表面上看起来,的确处于劣势。但不要忘记,统计这门科学,本来就是在数据稀缺的时代被发明的。统计的本质就是从有限甚至少量的数据中推断出普遍的规律。只要人或者机器不能达到全知全能,统计这门科学就有意义。 而且,machine learning 能够 work 的两个基本前提是数据有代表性和Chebyshev's Inequality。(当然,大部分数据从业者可能认为自己搞出来的东西能 work 的原因是自己吊。)现实中,数据量不满足Chebyshev's Inequality的情况比比皆是。比如说金融数据,数据量不足和heteroskedasticity 给 machine learning 在金融中的应用带来了巨大的挑战。在这种情况下,开发新的,数据需要量小的/收敛速度快的模型就变得非常有必要。而这种活,一般都是学术界干的比较好。 2)数据科学的前景 大部分人都不会否认,数据科学前景巨大。但到底是什么样的前景,有多巨大,每个人可能都有自己的理解。不管怎么理解,祝大家在新的浪潮中弄潮愉快。 (more...)
你是统计出身啊
heteroscedasticity
[本文发送自华新手机Wap版]
This page is intentionally left blank
欢迎来到华新中文网,踊跃发帖是支持我们的最好方法!原文 / 传统版 / WAP版只看此人从这里展开收起列表

本帖共有 55 楼,当前显示第 52 楼,本文还有 N-1 层楼,要不你试试看:点击此处阅读更多 >>



请登录后回复:帐号   密码