你好,我是悦创。

从这一讲开始,我们进入课程的新模块——收集数据。数据不是从天上掉下来的,需要先有数据,然后才能分析数据,所以收集数据是免不了的重要一环。这个模块,我们就详细讨论收集数据的各种方法。

提到数据,很多人的反应就是,不就是一堆大大小小的数字吗?除了大小不同,数据不都一样吗?如果你也这么觉得,那就说明你对数据的理解还很不到位。

所以,在讨论收集数据的各种方法之前,我们得先解决两个基础性问题。还记得上一讲的葡萄酒模型吗?数据是酒,数据载体是酒瓶,元数据是酒标。现在两个基础性的问题就是:

  • 一:数据收集之后放在哪里呢?换句话说,数据世界的酒瓶是什么样子的呢?

  • 二:数据是否有不同的类型呢?如果用酒来打比方的话,除了葡萄酒,还有没有啤酒白酒呢?

搞清楚了这两个问题,以后你再看到数据时,就能马上知道它代表什么意义、分辨出它是哪一类型的,也就不会再发懵了。

隐藏内容
本内容需权限查看
  • 普通用户: 100悦币
  • VIP会员: 100悦币
  • 永久会员: 免费

划重点:

  1. 数据、变量和表格是三个不同层次的概念。数据是一个变量的具体值,变量代表一个维度的信息,表格是各种维度信息的集合。

  2. 数据一共有四种类型,分别是类别数据、次序数据、间隔数据和比例数据,分别对应唐僧、沙和尚、猪八戒和孙悟空。

  3. 数据类型不同,处理数据的方法就不同。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。