1. Analysis of Research Strategies to Determine

1.1 论文中的数据分析内容

  1. 四种实验方法的比较
    • N-Alternative Forced Choice (N-AFC):让参与者在同时呈现的多种颜色中选择最喜欢的一种。
    • Rank-Order:要求参与者把所有颜色从最喜欢到最不喜欢排序。
    • Rating:给每个颜色打分,比如 0%-100% 表示不喜欢到最喜欢。
    • Paired Comparison:两两颜色比较,每次选一个更喜欢的,最后得到整体排序。
  2. 数据转换与标准化处理
    • 把不同方法的原始结果(选择次数、排序、打分、配对比较结果)转化为统一的 比例值 (0%–100%)
    • 再通过 Thurstone’s Law of Comparative Judgement(案例V) 转换成 区间尺度 z 分数,使不同方法的数据可以比较。
  3. 统计分析与结果
    • 比较四种方法得出的偏好顺序:多数情况下结果一致(橙色最受欢迎,绿色最不受欢迎)。
    • 使用 相关系数 (r²) 来衡量不同方法之间的一致性,以及样本量大小对稳定性的影响。
  4. Monte Carlo 模拟分析
    • 从 41 个样本中反复随机抽取不同数量的子样本(比如 n=36, 31, 26…直到 n=1)。
    • 每次计算颜色偏好顺序与完整样本的相关性(r²)。
    • 发现:当样本量小于 11 时,Rating、Rank-Order、Paired Comparison 更稳定;而 N-AFC 方法波动大

1.1.1 Monte Carlo 模拟分析

::: tip 我们不仅仅要知道老师论文涉及的知识、技术,更要了解老师的意图,为什么要使用某个技术?别的技术不行?

多思考,多实践。

::

  1. 基本定义:Monte Carlo 模拟是一种基于随机数和概率统计的计算方法。

  2. 核心思想:用大量随机样本来模拟和逼近复杂问题的可能结果,从而得到一个概率分布而不是单一的确定结果。

    简单说,就是“用随机数去模拟各种可能发生的情况,看大规模模拟之后的整体趋势”。

  3. 为什么需要 Monte Carlo 模拟?

    1. 很多现实问题(金融风险、项目工期、物理实验、排队模型等)太复杂,无法直接用数学公式精确解出结果。
    2. 比如:
      • 股票价格未来 1 年的波动?
      • 一个建筑项目完工的时间?
      • 投资组合的风险收益?
    3. 这些问题都存在不确定性,Monte Carlo 就是用随机模拟去近似求解。

1.2 涉及的数据分析原理解释

  1. 比例数据 (Proportion Data)

    • 将原始数据转化为百分比,方便不同方法之间比较。
    • 例如:如果 100 个人中有 40 人最喜欢蓝色,那么蓝色的偏好比例就是 40%。
  2. 区间尺度转化 (Interval Scaling, z-score)

    • 使用统计学方法(如 标准正态分布反函数)将比例值转化为 z 分数,消除了比例在极端(0% 或 100%)的限制,使数据能进行线性比较。
  3. 相关系数 r² (Coefficient of Determination)

    • 衡量不同实验方法结果与总体结果的一致性。
    • r²=1 表示完全一致,r² 越低说明差异越大。
  4. Monte Carlo 模拟

    • 一种随机抽样重复试验的方法。
    • 用来评估在不同样本规模下,实验方法的结果是否稳定。
    • 通过多次模拟得到一个概率分布,而不是依赖单次实验结果。
  5. 分析原理(步骤):

    Monte Carlo 模拟通常包含以下流程:

    1. 确定输入变量及其概率分布:(例如:股票年回报率符合正态分布(均值 8%,标准差 15%))

    2. 随机抽样:根据定义的分布,利用计算机生成大量随机数(成千上万次)

    3. 计算模型结果:将每次抽样代入模型公式,计算出对应的结果。

    4. 统计与分析

      1. 把所有模拟结果汇总,形成结果的概率分布。
      2. 从中可以得到:平均值、中位数、标准差、置信区间、最坏/最好情况概率等。
    5. 举例(现实生活场景)

      1. 🎲 例子 1:掷骰子

        1. 我想知道连续掷两个骰子,总和大于 8 的概率。
        2. 可以写出数学公式直接算,但 Monte Carlo 模拟是另一种方法:
          1. 模拟掷 100 万次骰子(随机生成 1~6 的点数)。
          2. 统计有多少次结果大于 8。
          3. 用次数/总次数 ≈ 概率。
        3. 结果会接近真实概率(≈ 0.278)。
      2. 💰 例子 2:投资收益

        1. 假设你买了一个基金,年化收益率平均 8%,但波动(标准差)15%。
        2. 用 Monte Carlo:
          1. 在未来 10 年里,每年随机抽取一个“收益率”来模拟基金表现。
          2. 重复 1 万次,得到 1 万条“基金 10 年后的价值曲线”。
          3. 汇总结果 → 可以看到 10 年后资产的 分布
            • 70% 的概率资产翻倍;
            • 10% 的概率资产亏损;
            • 最坏 1% 的情况甚至腰斩。

        这样比“单纯说平均收益 8%”更有参考价值,因为它揭示了风险区间

1.3 生活中的例子帮助理解

  1. N-AFC(多选一) 类似于点菜时,服务员把菜单上 6 道菜都端到你面前,让你直接选出“最想吃的那一道”。
    • 问题:如果参与者人数少,可能因为偶然选择导致结果偏差大。
  2. Rank-Order(排序) 就像你写“最喜欢的手机品牌排行榜”,把苹果、华为、三星、小米等从最喜欢到最不喜欢依次排列。
    • 优点:即使人数少,也能比较稳定地反映整体趋势。
  3. Rating(打分) 类似于电影评分(豆瓣 1–10 分制),每个人对每部电影都给分,最后算平均值。
    • 优点:能反映偏好强度(喜欢很多 vs 稍微喜欢)。
  4. Paired Comparison(两两比较) 像世界杯点球大战,每次两支球队对比,选一个胜出,最后得出冠军。
    • 缺点:如果参赛者太多,两两比较会非常耗时。
  5. Monte Carlo 模拟 就像你想知道“抛硬币 10 次正反面分布”是不是稳定。你会模拟成千上万次,每次都随机抛 10 次,然后统计结果,最终得到一个分布。
    • 在论文中,作者用它来测试“如果只收集到 6 个人的数据,结果还可信吗?”

1.4 数据转换

1.4.1 为什么要转换数据?

论文里有四种实验方法:

  • AFC(多选一) → 得到的是 “次数”;

  • Rank-Order(排序法) → 得到的是 “名次”;

  • Rating(打分法) → 得到的是 “分数”;

  • Paired Comparison(两两比较) → 得到的是 “胜出次数”;

问题来了:

  • 次数、名次、分数、胜出次数,本质上不是同一种量纲,没法直接比较。
  • 举个例子:一个人说“蓝色是第一名”,另一个人说“蓝色打 80 分”,这两种数据如果直接放在一起,没有可比性。

👉 所以,需要把它们 转化到同一个标准化的区间(0% ~ 100%),然后再进一步转化成 可以比较的数值(z 分数)

1.4.2 第一步:转化为比例 (0% – 100%)

就是把各种形式的回答,统一换算成一个比例值。

  • AFC(多选一):如果 100 个人里有 40 人最喜欢蓝色 → 蓝色偏好率 = 40%
  • Rank-Order(排序):假设 5 个人对蓝色排序分别是 1, 2, 3, 2, 1(分别代表蓝色的位置) → 平均名次 = 1.8 → 再转化为比例(例如计算成“蓝色有 70% 的人把它放在前三名”)。
  • Rating(打分):每个人对蓝色打分:70%、80%、90%、60% → 平均值 = 75%
  • Paired Comparison(两两比较):蓝色 vs 红色,10 次比较中蓝色赢 7 次 → 蓝色胜率 = 70%

这样,所有方法最后都可以变成类似:

蓝色:75%  
橙色:65%  
绿色:20%  
……

1.4.3 第二步:转化为区间尺度 z 分数

虽然比例已经能看了,但有一个问题:

  • 当比例接近 0% 或 100% 时,它的变化空间很小,不利于统计比较。
  • 比如从 90% 到 95%,看起来差了 5%,但实际差距可能比 40% 到 45% 要大得多。

👉 这时,就需要用到 Thurstone’s Law of Comparative Judgement(色彩心理学里常用),把比例转成 z 分数

什么是 z 分数?

  • 它来自标准正态分布。
  • 把比例(p 值)代入正态分布的反函数,就能得到一个对称的数值。
  • 中间(50%)对应 z=0,越偏向两端(0% 或 100%),z 的绝对值越大。

例子:

  • 50% → z = 0 (中性)
  • 84% → z = +1 (比平均好 1 个标准差)
  • 16% → z = –1 (比平均差 1 个标准差)

这样,就能把所有颜色的偏好值都映射到一个 连续的、可比的数轴上。

1.4.4 实际生活类比

  1. 投票选美比赛

    • 有的人只告诉你“谁第一名”;

    • 有的人给每个人打分(90分、80分…);

    • 有的人只做一轮一轮 PK。

      → 这些原始结果格式都不一样,没法直接说“谁最漂亮”。

      → 所以先要转成“百分比(多少人支持)”,再进一步变成一个统一的“标准化分数(z 分数)”。

  2. 考试成绩转 GPA

    • 有的学校用百分制(85 分),

    • 有的用等级制(A, B, C),

    • 有的用 5 星制。

      → 统一换算成 GPA(比如 A=4.0,85分≈3.7),才能放在一起比较学生成绩。

      这里 GPA 就相当于论文里的 “z 分数”。

  3. 外卖评分

    • 有人说“好吃”,有人打 5 星,有人给 9 分。

    • 平台为了排序,需要把它们转化为同一标准(比如 0–100 的分数,再标准化)。

1.5 总结

这篇论文的核心数据分析思路是:

  • 先把不同实验方法的数据转化为统一的区间尺度;
  • 再通过 相关系数Monte Carlo 模拟 检验方法的稳定性;
  • 结论是:当参与人数较少时,Rating、Rank-Order、Paired Comparison 更适合,而 N-AFC 容易不稳定

2. CRA_Yu_Westland_Li_Pan_Shin_Won

2.1 论文中的数据分析内容提炼

  1. 研究对象与实验设计
    • 共选择了 54 种日常家居产品(如牙刷、咖啡机、洗发水、拖鞋等)。
    • 每个产品被设计成 六种颜色版本(红、橙、黄、绿、蓝、紫)。
    • 实验分为 两种形式
      • 线上实验:173 名参与者,选择他们愿意购买的颜色。
      • 实验室实验:39 名参与者,除选择颜色外,还评估颜色与产品功能/性能的关系(用 5 点李克特量表,转化为 0–100% 分值)。
  2. 关键数据指标
    • 颜色一致率(Colour Consistency Rate)
      • 定义:参与者是否选择了与自己“最喜欢颜色”一致的产品颜色。
      • 计算方式:某产品选择与个人最喜欢颜色一致的比例。
      • 随机情况下理论值为 17%(因为 6 种颜色)。
      • 实验结果:
        • 在线实验平均一致率:34.2%
        • 实验室实验平均一致率:30.1% 👉 说明个人颜色偏好确实影响购买决策。
    • 功能/性能相关性评分
      • 例如:参与者评估“颜色是否影响该产品性能/功能”。
      • 结果:
        • 高相关性:漱口水 (66.7%)、洗洁精 (57.1%)、沐浴露 (56.4%)。
        • 低相关性:剪刀 (13.5%)、开瓶器 (16%)、椅子 (16.7%)。
    • 相关性分析
      • 研究者计算了 颜色一致率与功能/性能相关性之间的相关性
        • 在线实验:R² = 0.41
        • 实验室实验:R² = 0.64 👉 越是“颜色强烈暗示功能”的产品,个人颜色喜好影响越小。

2.2 涉及的数据分析原理

  1. 对照基准 (Baseline Comparison)
    • 设定 随机选择下的理论概率 17%,作为基准。
    • 如果实验结果明显高于 17%,说明个人颜色偏好对购买决策有显著影响。 👉 这是典型的 假设检验思路:和“无效假设”(随机选择) 对比。
  2. 相关性分析 (Correlation Analysis)
    • 使用 R²(决定系数) 衡量颜色一致率与功能/性能评分之间的关系。
    • R² 越高,说明产品的“功能相关性”越能解释颜色偏好的作用强弱。 👉 这是 回归分析/相关性分析 的应用。
  3. 分类比较 (Group Comparison)
    • 研究对比了不同产品、不同颜色、不同实验条件(线上 vs 实验室)的差异。 👉 属于 多维度数据分析,常用于消费者研究。

2.3 生活中的实际例子

  1. 漱口水的颜色选择
    • 大多数人觉得蓝色漱口水“更干净、杀菌力强”,绿色漱口水可能让人联想到“苹果味”或“天然”。
    • 即使你最喜欢的颜色是紫色,你可能也不会买紫色的漱口水。 👉 功能相关性强,个人偏好影响弱。
  2. 牙刷的颜色选择
    • 功能上,红色和蓝色牙刷没什么差别。
    • 在这种情况下,人们更容易选择自己喜欢的颜色。 👉 功能相关性弱,个人偏好影响强。
  3. 家电的颜色选择
    • 烤箱、咖啡机等加热产品,很多消费者倾向选择红色或黑色,因为联想到“热、稳重、耐用”。
    • 而苹果 iPod Nano 则可以推出彩色系列,消费者愿意根据喜好挑选。 👉 部分产品靠颜色“功能暗示”,部分产品依赖“个人偏好驱动”。

2.4 总结

论文中的数据分析核心是:

  • 通过 颜色一致率 测量个人喜好对购买行为的影响;
  • 通过 相关性分析 验证“功能/性能相关性”与个人喜好作用的关系;
  • 得出结论:
    • 当颜色与产品功能/性能强相关时,个人偏好作用弱(如漱口水、洗洁精);
    • 当颜色与功能无关时,个人偏好作用强(如牙刷、椅子)。

换句话说,颜色的营销价值,要看产品类型

  • 日常消耗品:颜色→功能暗示更重要。
  • 个性化产品:颜色→个人偏好更重要。

3. Proceeding_official (dragged)2

3.1 论文中的数据分析方法

  1. 实验设计与数据采集
    • 研究对象:60 块彩色织物样本(20 种颜色 × 3 种材质:棉、麻、丝)。
    • 测试人群:80 名受试者(男女各 40,18-35 岁,具备色彩科学训练)。
    • 实验方式:心理物理学实验,参与者在标准光源 D65 下观看并触摸样本。
    • 评价指标:使用 7 点 Likert量表(从“冷-暖”、“薄-厚”、“男性化-女性化”、“不愉快-愉快”等八个维度进行打分)。
  2. 数据表示与处理
    • 每块织物的颜色用 CIELAB 色彩空间(L, a, b*)进行量化。
      • L* = 明度(亮暗)
      • a* = 红-绿通道
      • b* = 黄-蓝通道
    • 数据处理:将主观评价量表分数转化为区间数据进行统计分析。
  3. 统计分析方法
    • 配对 t 检验(Paired t-test) 检验不同材质间(棉 vs 麻、麻 vs 丝、棉 vs 丝)在八个感知维度上的差异显著性。结果发现,>70%对比显著,尤其在“厚薄”、“冷暖”、“男性化-女性化”维度。
    • 相关分析 分析 CIELAB 色彩值与感知评价之间的相关性。例如:
      • 明度 L* 与“丝绸-唤醒度”的相关系数高达 0.89
      • a* 值(红-绿轴)更强烈影响了麻的“女性化”感知(r=0.50)。
      • b* 值(黄-蓝轴)更影响棉布的“愉悦”感知(r=0.55)。

3.2 涉及的数据分析原理

  1. 心理量表 → 定量化
    • 把主观的“暖/冷”“喜欢/不喜欢”用 7分制数字化,便于统计。
    • 原理:把“定性感受”转化为“定量数据”,才能比较和分析。
  2. 显著性检验(t检验)
    • 判断不同材质或颜色带来的感知差异是否真实存在而非偶然。
    • 原理:如果p值 < 0.05,就认为差异显著。
  3. 相关分析
    • 研究数值型变量之间的关系(比如明度和愉悦感)。
    • 原理:相关系数 r 接近 ±1 代表强相关,接近 0 代表弱相关。
  4. 多变量分析
    • 一个感知结果往往同时受到多因素(材质、颜色、明度、色相)的影响。
    • 原理:通过分解 a, b, L* 等参数,找到主导因素。

3.3 生活中的类比与例子

  1. Likert 量表的生活应用
    • 在餐厅吃饭后,你可能被要求对“味道”“服务”“环境”打 1-7 分。这与论文中让受试者评价“冷暖感”“厚薄感”是一样的原理。
  2. 显著性检验的例子
    • 比如商场要验证“红色促销标签是否比蓝色标签更吸引人”。他们可以记录两组标签下的购买率,用t检验来判断差异是否显著。
  3. 相关分析的例子
    • 天气与冰淇淋销量:温度(数值)与销量(数值)常常有正相关,越热卖得越多。
    • 对应到论文中:布料越亮(L*值高),受试者对“丝绸-唤醒度”的打分就越高。
  4. 多变量影响的例子
    • 选购一部手机,你的满意度不仅取决于“外观颜色”,还取决于“重量、手感、品牌”。这和论文中研究“颜色+材质共同影响人类感知”是一样的道理。

总结:这篇论文通过 心理量表 → 定量化、统计检验、相关分析 等方法,揭示了“颜色”和“材质”如何影响人们对织物的感知。这套数据分析思路完全可以迁移到日常场景,比如消费者调查、市场营销、产品设计等领域。

3.4 配对 t 检验

3.4.1 什么是配对 t 检验?

配对 t 检验是一种统计方法,用来比较同一组对象在不同条件下的差异是否显著。

👉 “这两个情况的差别,是真实存在的,还是只是巧合?”

  • 核心思想:看“差异”是不是偶然的。

  • 前提:同一对象在两种情境下都有结果(成对数据)。

  • 结果解读

    • p < 0.05 → 差异显著,说明条件真的影响了结果;
    • p ≥ 0.05 → 差异不显著,说明差异可能只是随机波动;
  • 假设你想知道:“苹果手机是不是比安卓手机拍照更好看?”

  • 你找了 50 个朋友,每个人用 同一场景拍两张照片:一张用苹果,一张用安卓。

    然后让他们打分(比如 1-7 分)。

    • 如果大家普遍觉得苹果分数更高,而且差距不是一点点,那么配对 t 检验会告诉你:

      → “是的,这差别是真的,不是运气。”

    • 如果差距很小,很多人时高时低,配对 t 检验就会告诉你:

      → “这可能只是随机波动,不算真差别。”

  • 为什么叫“配对”?

    因为同一个人要同时体验两种情况(苹果 vs 安卓),结果是一对一对的,这就是“配对数据”。

3.4.2 在论文里的应用

研究者想知道:

“同一种颜色放在不同材质的布料上,人们的感知是不是会变?”

论文比较了同一种颜色,但放在不同材质上(棉 vs 麻、麻 vs 丝、棉 vs 丝),人们的感知是否不同。

例子:

  • 一块“红色棉布” vs “红色丝绸”

    受试者对“厚薄感”“冷暖感”“男性化-女性化”打分不同。

    如果这个差异在统计学上显著(p < 0.05),就能说明:材质确实会改变人对颜色的感知


  • 比如:红色棉布 vs 红色丝绸
  • 让同一个人分别给这两块布的“厚薄感、冷暖感、男性化-女性化”等打分。
  • 然后比较这两组打分的差异。

如果统计出来差异很大(p<0.05),说明材质真的改变了人们对颜色的感觉。如果差异很小,就说明只是巧合,材质其实没啥影响。

3.4.3 生活中的类比

3.4.3.1 场景 1:咖啡店饮品口感
  • 你喝同一款“拿铁”,但杯子材质不同:
    • 纸杯 → 感觉比较轻便、普通
    • 陶瓷杯 → 感觉更有质感、咖啡更香
  • 如果调查 80 个人的评分,再用配对 t 检验,就能判断:“杯子材质”是不是对“口感体验”真的有显著影响
3.4.3.2 场景 2:考试成绩对比
  • 学生在期中考试和期末考试都参加了(同一组学生 → 成对数据)。
  • 用配对 t 检验,可以判断:期末的平均分和期中相比是否有显著提高
  • 如果显著 → 说明学习方法/复习有效;如果不显著 → 可能只是随机波动。
3.4.3.3 场景 3:健身前后体重
  • 20 个人在健身前、健身后都称体重。
  • 用配对 t 检验比较“健身前后体重差异”是否显著。
  • 如果显著 → 说明健身计划真的有效。
  • 如果不显著 → 说明效果可能并不稳定。

3.5 总结

  • 配对 t 检验 关注的是“同一样本两种条件下的差异”

  • 在论文中:

    → 是“同一种颜色”放在“不同材质”上,人们打分的差异。

  • 在生活中:

    → 可以用在饮品体验、考试成绩前后对比、健身效果等场景。

这样理解:它就是一把“检测差异是不是靠谱的尺子”

4. Yu_Westland_Chen_Li_CRA_2021

4.1 论文中的数据分析内容

4.1.1 实验设计与数据收集

  • 实验对象:37 位参与者(男女各半)。
  • 测试产品:51种不同类别的产品(如闹钟、牙膏、衣服、食品、电子产品等)。
  • 颜色选择:6 种基本颜色(红、橙、黄、绿、蓝、紫),使用 Adobe 系统定义并在实验室控制显示条件下呈现。
  • 研究方法
    • 6-AFC(6选1强制选择):参与者在每个产品的六种颜色中选择他们最愿意购买的。
    • Rank-order 排序:参与者将六种颜色按个人喜好排序。
    • 访谈:进一步询问参与者为什么选择某一颜色,以及对颜色本身的联想。

4.1.2 数据分析方法

  • 颜色一致率(Colour Consistency Rate)
    • 定义:某个产品的颜色选择与参与者个人偏好排序的一致程度。
    • 结果:大约 33.7% 的选择落在个人最喜欢的颜色,22.6%落在第二喜欢,依次递减。说明个人颜色偏好会影响购买决策,但不是唯一决定因素。
  • 颜色联想分析(Colour Association Analysis)
    • 使用 NVivo 软件进行“模板分析法(Template Approach)”。
    • 逐步方法:
      1. 按颜色名称建立编码框架(如红=激情、文化、警示)。
      2. 对访谈记录进行编码。
      3. 聚合相似数据,形成主题(如“蓝=冷静”、“绿=自然/清新”)。
  • 产品-颜色联想得分(Product-Colour Association Score)
    • 定义:产品颜色选择原因中,与颜色本身联想一致的比例。
    • 结果:平均得分约为 34.56%
    • 高分产品:除臭剂(83%)、剃须水(82%)、奶酪(76%) → 强烈受颜色联想影响。
    • 低分产品:鞋子(3%)、耳机(5%)、游戏机(9%) → 几乎不受颜色联想影响。
  • 相关性分析
    • 产品-颜色联想得分颜色一致率进行相关性检验。
    • 结果:相关系数 r² = 0.32(中等相关)。
    • 结论:当颜色联想强时,个人偏好影响较弱;反之,个人偏好作用更大。

4.1.3 论文结论

  • 消费者的颜色偏好确实影响产品购买颜色的选择,但 颜色联想是新的重要“主导因子”。
  • 不同产品类别受到颜色联想的影响差异很大。
  • 平均来看,约三分之一的购买理由可以直接追溯到颜色联想。

4.2 涉及的数据分析原理解释

4.2.1 偏好一致性分析(Preference Consistency Analysis)

  • 原理:通过比较“个人总体偏好”与“实际选择”,衡量一致性。
  • 现实例子:
    • 你最喜欢蓝色,但买衣服时并不总选蓝色。若某产品类别(比如牙刷)功能无关颜色,你会更倾向选择蓝色 → 偏好一致率高。
    • 但买食物(比如牛奶包装),可能选择白色或绿色,因为它们有“纯净/健康”的联想,即使你不喜欢白色。

4.2.2 质性编码与模板分析(Qualitative Coding & Template Analysis)

  • 原理:把受访者的描述转化为分类标签,并统计频率,提炼主题。
  • 现实例子:
    • 如果受访者说“我觉得蓝色很安静”,研究者会把这句话编码为“蓝=冷静”。
    • 类似编码汇总后,就能看出蓝色与“冷静/清爽”联想最强。

4.2.3 相关性分析(Correlation Analysis)

  • 原理:通过相关系数检验两个变量之间的关系(如颜色联想得分 vs 偏好一致率)。
  • 现实例子:
    • 当产品高度依赖颜色联想(如“绿色=环保” → 绿色垃圾桶),消费者不会只按个人最喜欢的颜色买,而是优先考虑“联想”。
    • 而鞋子、耳机这类功能/联想弱的产品,消费者会更随个人偏好。

4.3 结合实际生活的例子

  1. 食品包装
    • 红色辣酱:红色=热辣、刺激 → 消费者会认为红色更正宗,即使个人不爱红色。
    • 绿色酸奶:绿色=健康、自然 → 更容易让人觉得低脂、环保。
  2. 日用品
    • 蓝色洗衣液:蓝色=清新、干净 → 提高信任感。
    • 黄色清洁剂:黄色=强力、去污 → 给人强清洁力的心理暗示。
  3. 电子产品
    • 手机壳:大部分人按个人喜好颜色买,因为功能不依赖颜色。
    • 耳机:颜色联想弱,基本随个人审美走。

✅ 总结一下:这篇论文通过 实验+访谈+统计分析+质性编码 的混合方法,验证了一个新的数据分析框架:消费者的产品颜色决策不仅取决于个人偏好,还取决于颜色联想。换句话说,买牙刷可能看个人喜欢的颜色,但买食物、护肤品等更容易受到“红=热辣、绿=健康、蓝=清新”等颜色联想影响。

4.4 流程原理:一步步怎么做?

你可以把它想象成 “收拾一屋子杂乱的书和东西”

  1. 收集材料

    • 论文里:研究者收集了参与者在访谈里说的话,比如“我觉得蓝色很安静”、“绿色让我想到健康”。

    • 生活类比:就像你采访同学“你喜欢什么水果?为什么?”,收集到很多回答:有人说“苹果甜”,有人说“香蕉好消化”,有人说“草莓好看”。

  2. 初步分类(建立编码框架)

    • 论文里:研究者先给颜色起标签框架,比如“红=激情、警示”,“蓝=冷静、清新”,“绿=自然、环保”。

    • 生活类比:你把同学的水果理由归类:

      • 味道类(甜、酸)

      • 健康类(好消化、维生素多)

      • 外观类(好看、鲜艳)。

  3. 给回答打标签(编码)

    • 论文里:每一句话被标记上对应的标签,比如“蓝色让我想到安静” → 打上“蓝=冷静”;“绿色像大自然” → 打上“绿=自然”。

    • 生活类比:把“我喜欢苹果,因为甜” → 打上标签“味道-甜”;“我喜欢草莓,因为颜色好看” → 打上标签“外观-好看”。

  4. 聚合同类信息(模板分析 Template Approach)

    • 论文里:所有“蓝=冷静”的回答聚在一起,所有“绿=自然”的回答聚在一起。最后统计每类出现的次数和比例。

    • 生活类比:你发现大部分同学喜欢水果是因为“味道”,其次是“健康”,最后才是“外观”。

  5. 总结规律

    • 论文结果:发现消费者选择某些产品颜色的原因,跟这些颜色的“典型联想”是一致的。比如:
      • 绿色牙膏 → 因为“绿色=清新、自然”;
      • 蓝色洗衣液 → 因为“蓝色=干净、冷静”。
    • 生活类比:你总结出 → 人们选水果,味道因素(甜/好吃)比外观因素(好看)更重要。

4.5 为什么叫“模板分析”?

“模板”不是 PPT 模板,而是指一个 “初步的分类框架”。研究者先假设一些可能的分类(比如颜色=联想),然后在收集到的数据里不断验证和调整。

  • 一开始模板可能粗糙:

    • 红色=激情;
    • 蓝色=冷静;
    • 绿色=自然。
  • 收集到更多回答后,可能细化:红色不仅是激情,还可能是“警示”;蓝色不仅冷静,还可能是“科技感”。

    👉 模板就像“空格表格”,数据填进去,最后形成更准确的分类体系。

4.6 举个完整生活例子

假设你要研究 “人们为什么喜欢不同的饮料”

  1. 访谈收集到的话:

    • “我喜欢可乐,因为它让我兴奋。”
    • “我喜欢绿茶,因为很健康。”
    • “我喜欢牛奶,因为有营养。”
    • “我喜欢果汁,因为酸甜可口。”
  2. 建立模板(初步分类框架):

    • 功能类(健康、营养)
    • 体验类(兴奋、味道)
  3. 编码:

    • 可乐=体验类-兴奋
    • 绿茶=功能类-健康
    • 牛奶=功能类-营养
    • 果汁=体验类-味道
  4. 聚合:

    • 功能类:健康+营养 = 2票
    • 体验类:兴奋+味道 = 2票
  5. 总结规律:

    • 一半人喜欢饮料是因为功能(健康、营养),一半是因为体验(好喝、刺激)。
  6. 总结:质性编码与模板分析 = 用标签法,把零散的文字答案变成有规律的数据,再总结出普遍规律。 就像:

    1. 收拾房间 → 把书放到书架,衣服放到衣柜,玩具放到盒子。
    2. 研究访谈 → 把“蓝色=冷静”“绿色=自然”都归到一个类里,再统计多少人这么说。

5. SPSS 与 Python 对比表

对比维度 SPSS Python
定位 专业统计软件,主要用于社会科学、医学、教育研究 通用编程语言,覆盖统计分析、数据挖掘、机器学习、AI
操作方式 主要通过 图形界面 (GUI),也支持 SPSS Syntax 通过 编程pandasnumpyscikit-learnstatsmodels 等库)
学习门槛 入门简单,统计基础 + 软件操作即可 需要学编程,门槛较高,但学习后能力更广
输出结果 自动生成标准化结果表、显著性检验、置信区间,论文可直接用 输出灵活,可自定义表格、图表、报告,但需额外代码处理
功能深度 传统统计分析强大(t检验、ANOVA、回归、因子分析等) 不仅能做统计,还能做 机器学习、深度学习、NLP
扩展性 扩展性差,依赖 SPSS 本身功能 可通过库无限扩展,和数据库、网页爬虫、API 结合
可重复性 GUI 操作难以完全复现,Syntax 脚本有限 代码高度可复现,可一键自动化批量处理
适用人群 非程序员、社会科学/医学/教育研究者 数据科学家、数据分析师、程序员、科研人员
成本 商业软件,费用高 开源免费
学习资源 教材、培训课程多,偏应用导向 学习资料更丰富,社区活跃,偏技术导向

5.1 优势对比

::: tip 2025 年 8 月 31 日

社会因不同而发展,市面所上市发布的软件都是发布通用性,不具有针对性。而针对性的软件功能,等企业给你开发是不切实际的,不要觉得自身的需求对于软件公司“很重要”。自己想要的,还是得自己去实现,就这么简单。

故而一般我们都会选择 SPSS + Python 结合开发使用。

核心还是需要自己有想法💡

::

5.1.1 SPSS 的优势

  1. 上手快,点点鼠标就能跑统计,适合非程序员。
  2. 输出结果直观,符合论文要求(表格/显著性/置信区间)。
  3. 教学和社会科学研究中应用广泛,培训课程多。

5.1.2 Python 的优势

  1. 免费开源,成本低。
  2. 灵活性强,不仅能做统计,还能做机器学习、AI、自动化。
  3. 可扩展性极高(和 Excel、数据库、网页爬虫、API 结合)。
  4. 高度可重复,适合科研、工业级项目。
  5. 社区活跃,学习资源丰富。

📌 总结一句话

  • SPSS 更像“统计计算器” → 快速得出结果,适合研究者。
  • Python 更像“统计实验室” → 你能自定义方法、自动化、扩展到 AI。

6. The Effects of colour in human fabric perceptions

6.1 论文中的数据分析内容

  1. 实验方法设计(数据收集方式)

    • N-Alternative Forced Choice (N-AFC):让参与者从多个颜色中选择自己最喜欢的。
    • Rank-Order 排序:要求参与者按喜好程度对所有颜色进行排序。
    • Rating 评分:让参与者对每个颜色进行打分(如 0–100 分)。
    • Paired Comparison 成对比较:让参与者两两比较颜色,每次选出一个。

    👉 这些方法产生了不同类型的数据(分类数据、排序数据、区间数据),论文通过这些实验获取人类对布料颜色的偏好与感知。

  2. 统计分析方法

    • 方差分析 (ANOVA):用来比较不同颜色、不同布料在感知结果上的差异是否显著。

    • 相关分析:研究颜色偏好和其他特征(如材质光滑度、柔软度)之间的关系。

    • 多维尺度分析 (MDS):把复杂的颜色感知数据映射到二维或三维空间中,帮助直观地看出颜色之间的相似度。

    • 聚类分析:将偏好相近的颜色或布料分到一组,发现潜在模式。

  3. 关键结论

    • 不同颜色显著影响人们对布料的“温暖感、柔软感、质量感”的主观评价。

    • 数据显示,暖色调(红、橙)更容易让人觉得布料柔软温暖;冷色调(蓝、绿)更偏向“坚硬、清凉”的感知。

    • 色彩与材质本身的交互效应也很明显:同一种颜色在丝绸和粗布上的感知完全不同。

6.2 数据分析原理解释 + 生活例子

  1. Forced Choice / 排序 / 打分

    • 原理:通过不同的调查问法获取不同粒度的数据。
    • 例子:你去奶茶店,老板问你:
      • Forced Choice:你要奶茶还是咖啡?(二选一)
      • Rank-Order:把奶茶、咖啡、果汁、可乐从最喜欢到最不喜欢排个顺序。
      • Rating:给奶茶、咖啡、果汁分别打分(比如奶茶 90 分,咖啡 70 分)。
    • 这三种方式得到的数据不同,研究者根据实验目的选择合适的方法。
  2. 方差分析 (ANOVA)

    • 原理:比较多个组的均值,看差异是不是“显著”而不是随机波动。

    • 例子:假设有 30 个人试穿三种颜色的 T 恤(红、蓝、绿),然后对“舒适度”打分。ANOVA 能告诉我们红色和蓝色 T 恤的舒适度评分差异是不是有统计意义,而不是因为“碰巧样本不同”。

  3. 多维尺度分析 (MDS)

    • 原理:把“相似度”或“距离”数据映射到二维/三维图里,让人能直观理解。

    • 例子:假设你喜欢的饮料有奶茶、绿茶、咖啡、可乐。别人觉得奶茶和绿茶很像,但咖啡和可乐差异大。MDS 会画出一个二维坐标图,把“像的东西”放在一起,“不像的东西”放远一点。

  4. 聚类分析

    • 原理:把数据分组,让同类的东西聚在一起。

    • 例子:商场根据购物记录把人群分为“爱买运动装”“爱买奢侈品”“爱买居家用品”。

    • 在论文里,研究者把“偏好相似的颜色和布料”分组,帮助时尚设计师定位市场。

总结

这篇论文主要用到了 实验设计 + 统计分析方法(ANOVA、相关分析、MDS、聚类) 来研究颜色对布料感知的影响。

现实生活中,你可以把这种分析方法类比到 饮料选择、衣服购买、甚至美食口味 上,用不同的数据收集和分析方法,帮助理解人们的偏好和感知规律。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。