Claude 零基础入门数据分析全攻略 – 第三部分
DIG方法论终章:目标设定与可视化能力 – 从正确方向到完美呈现
第一部分:核心提纲
DIG方法论回顾
DIG = Description + Introspection + Goal Setting
- D = Description(数据描述) – 让你和AI都看清数据
- I = Introspection(数据内省) – 让AI证明它真的懂
- G = Goal Setting(目标设定) – 确保分析方向正确
DIG方法的本质: 探索性数据分析(EDA)的AI版本。传统方法是拿到数据直接做图,几小时后发现方向错了;DIG方法用前20分钟走完框架,发现问题、确认方向,节省几小时返工时间。
第三步:G – Goal Setting(目标设定)
为什么这步最重要?
反面案例:
老板:"分析一下销售数据" 你:辛苦做了20张精美PPT,各种图表 老板:"等等...我只想知道是否该停产产品X"
Jeff的吐槽:
“当我们的经理是白痴…我是说…当我们在没有清晰目标的情况下分析数据,结果就是技术上正确但完全无用”
目标设定提示词模板
我的目标是理解【在此具体说明目标】。鉴于此目标,我们应该关注数据的哪些方面?
Jeff的实战目标示例:
“理解Apple TV下一步应该投资什么内容”
Tina的对比案例:同样数据,不同目标
场景A:LinkedIn分享
My goal is to answer these questions and turn them into a really exciting interesting report to post on LinkedIn 我的目标是回答这些问题并做成超有趣的报告发布到LinkedIn
→ AI会给你社交媒体风格的分析 + LinkedIn发帖建议
场景B:给老板的报告
My goal is to generate a serious report for my boss regarding salary trends 我的目标是为老板生成关于薪资趋势的严肃报告
→ AI会给你正式商务风格的分析
记忆点: Same data, different goals = 完全不同的输出风格
AI的任务简报:有目标 vs 无目标
没有目标时:
- AI会做所有可能的分析
- 生成一堆图表
- 你不知道哪个重要
有目标后(Jeff的案例):AI的分析路线图
基于你的目标"决定内容投资方向",建议: 第1步:清理数据 第2步:建立体裁记分卡 第3步:排序投资机会 第4步:叠加趋势速度 ← Jeff:"我永远想不到这个" 第5步:用离群值压力测试
示例深度洞察
True Crime(真实犯罪)系列分析
- 观看量 = 中位数的3倍
- 每完成小时成本低18%
- 观看份额:3年从4%升至9%
- 结论: 这是一个值得投资的体裁
Jeff的感叹:
“有了明确目标,AI直接给我投资建议,而不是一堆无用的统计数字”
4. 衍生篇 – 可视化生成:Claude的超能力
本部分案例来源: Krystian Wojtarowicz (KW) 的演示视频,使用100年S&P 500历史数据展示Claude的代码执行和交互式可视化能力
4.1 基础可视化(1分钟生成)
快速启动提示词
分析这个文档并创建可视化 analyze for me this document and create visualization
适用场景: 快速了解数据概况
Claude特色:
- 生成交互式图表(可点击查看具体数值)
- 自动运行Python代码生成可视化
- 界面会显示”正在运行代码”的新窗口
4.2 双指标关系分析(金融级案例)
完整提示词(KW的S&P 500案例)
analyze for me this document create a clear simple visualization to show the relationship between the S&P 500 values and dividend yield over year include labels and make the graph easy to understand 分析这个文档 创建清晰简单的可视化 展示S&P 500值和股息收益率在年份上的关系 包含标签,让图表易于理解
Claude自动生成的洞察:
- “股息收益率在1940s市场低迷期达到峰值”
- “S&P 500在1980年代后显著增长”
- “2000年后股息收益率相对较低”
故障修复实例
问题: 数据在图上不可见
解决提示词
I don't see the data on the graph, make it visible 我在图上看不到数据,让它可见
记忆点: “首次尝试可能不完美”(真实使用体验)
4.3 数据切片(大数据集精准提取)
场景: 100年数据太多,只看特定时间段
精准切片提示词
take 20 years of the data starting from 1928 compare the S&P 500 value, dividend yield and bond rate over this 20 years span create a visual representation that highlights the trends focus on showing how the S&P 500 values have changed in relation to dividend yield and bond rates 从1928年开始提取20年数据 对比S&P 500值、股息收益率和国债利率 在这20年期间的变化 创建突出趋势的可视化 重点展示S&P 500如何随股息和国债变化
核心能力: 精准切片任意时间段/子集
4.4 多图表组合(高级技巧)
多图组合提示词结构
create three separate graphs for the S&P 500 data set: 1. a line graph showing how the S&P 500 value changes over time 2. a bar chart showing the dividends paid each year 3. a scatter graph showing the bond rate changes over time Finally, create one combined graph that overlays all three metrics 为S&P 500数据创建三个独立图表: 1. 折线图 - S&P 500值随时间变化 2. 条形图 - 每年支付的股息 3. 散点图 - 国债利率变化 最后,创建一个组合图叠加所有三个指标
输出结果:
- 折线图(S&P 500值)
- 条形图(股息,带灰色高亮)
- 散点图(国债利率)
- 组合叠加图(三个指标在一张图上)
记忆点: Claude能理解”先分别展示,再组合”的复杂指令
第二部分:资源索引
图表类型决策树
你的数据是什么类型?
你的数据是什么类型?
│
├─ 时间序列数据(年份/月份/日期)
│ └─ 用 LINE GRAPH(折线图)
│ 提示词:"line graph showing how [指标] changes over time"
│
├─ 分类对比数据(不同产品/地区/类别)
│ └─ 用 BAR CHART(条形图)
│ 提示词:"bar chart showing [指标] for each [类别]"
│
├─ 分散点数据(需要看分布规律)
│ └─ 用 SCATTER GRAPH(散点图)
│ 提示词:"scatter graph showing [指标] distribution"
│
└─ 需要对比多个指标?
└─ 先生成各自图表,再用 COMBINED OVERLAY
提示词:"create combined graph that overlays all metrics"
核心提示词模板库
1. 目标设定模板
我的目标是理解【具体目标】。鉴于此目标,我们应该关注数据的哪些方面? My goal is to understand [specific goal]. Given this goal, what aspects of the data should we focus on?
2. 基础可视化模板
分析这个文档并创建可视化 analyze for me this document and create visualization
3. 关系分析模板
创建清晰简单的可视化,展示【指标A】和【指标B】在【维度】上的关系,包含标签,让图表易于理解 create a clear simple visualization to show the relationship between [metric A] and [metric B] over [dimension], include labels and make the graph easy to understand
4. 数据切片模板
从【起始点】开始提取【时长】的数据,对比【指标列表】在这段期间的变化,创建突出趋势的可视化 take [duration] of the data starting from [start point], compare [metrics list] over this span, create a visual representation that highlights the trends
5. 多图组合模板
创建【数字】个独立图表: 1. 【图表类型1】 - 展示【内容1】 2. 【图表类型2】 - 展示【内容2】 3. 【图表类型3】 - 展示【内容3】 最后,创建一个组合图叠加所有指标 create [number] separate graphs: 1. [chart type 1] showing [content 1] 2. [chart type 2] showing [content 2] 3. [chart type 3] showing [content 3] Finally, create one combined graph that overlays all metrics
常见问题快速解决
问题1:图表显示不完整
解决方案:
I don't see [具体内容] on the graph, make it visible 我在图上看不到【具体内容】,让它可见
问题2:图表样式不满意
解决方案:
make the graph more [形容词] 让图表更【形容词】 示例: - make the graph more professional(更专业) - make the graph more colorful(更多彩) - make the graph cleaner(更简洁)
问题3:需要调整时间范围
解决方案:
focus on the period from [起始] to [结束] 聚焦于从【起始】到【结束】的时期
问题4:需要对比特定子集
解决方案:
compare only [条件A] and [条件B] 只对比【条件A】和【条件B】
第三部分:总结与行动
关键要点总结(TL;DR)
- 目标设定是DIG方法论的终极武器 – 决定分析方向,避免做无用功。相同数据+不同目标=完全不同的输出风格
- 明确目标让AI成为战略顾问 – 无目标时AI只是制图工具,有目标后AI会主动设计分析路线图,甚至提出你想不到的角度
- Claude的可视化能力是真正的超能力 – 交互式图表、自动代码执行、对话式调试、理解复杂组合指令,让数据分析从专业技能变成日常对话
- 从简单到复杂的渐进式提示词 – 基础可视化→关系分析→数据切片→多图组合,每个层级都有标准模板可复用
- DIG完整流程的时间投资回报 – 前20分钟走完D-I-G框架,节省几小时返工时间。Description看清数据、Introspection确认理解、Goal Setting锁定方向
DIG方法论的终极金句:
“不要让AI成为你的制图工具,要让AI成为你的数据战略顾问。方法很简单:告诉它你的目标,它就会告诉你该怎么做。”
— Jeff Su,《Claude数据分析教程》