
你好,我是悦创。
从这一讲开始,我们进入课程的新模块——收集数据。数据不是从天上掉下来的,需要先有数据,然后才能分析数据,所以收集数据是免不了的重要一环。这个模块,我们就详细讨论收集数据的各种方法。
提到数据,很多人的反应就是,不就是一堆大大小小的数字吗?除了大小不同,数据不都一样吗?如果你也这么觉得,那就说明你对数据的理解还很不到位。
所以,在讨论收集数据的各种方法之前,我们得先解决两个基础性问题。还记得上一讲的葡萄酒模型吗?数据是酒,数据载体是酒瓶,元数据是酒标。现在两个基础性的问题就是:
-
一:数据收集之后放在哪里呢?换句话说,数据世界的酒瓶是什么样子的呢?
-
二:数据是否有不同的类型呢?如果用酒来打比方的话,除了葡萄酒,还有没有啤酒白酒呢?
搞清楚了这两个问题,以后你再看到数据时,就能马上知道它代表什么意义、分辨出它是哪一类型的,也就不会再发懵了。
划重点:
-
数据、变量和表格是三个不同层次的概念。数据是一个变量的具体值,变量代表一个维度的信息,表格是各种维度信息的集合。
-
数据一共有四种类型,分别是类别数据、次序数据、间隔数据和比例数据,分别对应唐僧、沙和尚、猪八戒和孙悟空。
-
数据类型不同,处理数据的方法就不同。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
评论(0)