前言:
本文章從 MySQL 查詢、Quick BI 報表、Python 數(shù)據(jù)分析、業(yè)務思維、分析模型這五個數(shù)據(jù)分析師核心技能出發(fā),全程使用提問式的教學形式(基于職場二人,師傅帶徒弟),對數(shù)據(jù)分析中的50+高頻率工作場景實戰(zhàn)任務,進行生動有趣的講解,每個任務按照“任務背景、真實任務內(nèi)容、完成任務”的線索搭建結構完整數(shù)據(jù)分析技能體系。幫助學員從零開始無痛入門數(shù)據(jù)分析,并最后成為公司不可或缺的
數(shù)據(jù)分析高值價人才。
一、MySQL的三種查詢方法
1、投影查詢
* : 代表所有字段(列)
查詢所有, 這個所有分成兩個部分
(1)所有的行數(shù)據(jù) (2)所有的列數(shù)據(jù)
select * from student;
這種情況會造成一種后果: 當我們數(shù)據(jù)量比較大,且數(shù)據(jù)表的字段比較多的時候, 效率很低;
真實情況,可能我們不需要這么多數(shù)據(jù),比如: 只需要學生的 姓名和性別;
查詢出來的這些數(shù)據(jù)是存放在什么地方的? =>內(nèi)存 =>查詢所有的字段是比較消耗內(nèi)存;
2、限制查詢(*)
關鍵字 : limit ;這個限制查詢在數(shù)據(jù)庫的查詢是用來干啥的 => 用來分頁;
為什么需要分頁? =》 比如:京東 商品數(shù)據(jù) 上萬條 => 一次性查詢出來 =>直接內(nèi)存溢出 => OOM =>宕機/卡,所以就需要將數(shù)據(jù)進行分批次的查詢出來 => limit;
3、條件查詢
關鍵字: where => 在哪里? => 條件,通過where后面的條件對數(shù)據(jù)進行查詢
(1)單條件
select * from sutdent where stu_name="JACK";#只有一個條件,只查詢對應的數(shù)據(jù)
(2)多條件
在JS中 多條件用的邏輯運算符: &&(與) ||(或)!(非)
但是在數(shù)據(jù)庫中多條件用的邏輯運算符為:and or not
二、Quick BI企業(yè)報表
Quick BI企業(yè)報表
報表:用表格、圖表等格式來顯示數(shù)據(jù)。報表是商業(yè)智能(BI)的基礎應用
數(shù)據(jù)可視化:指將相對復雜的數(shù)據(jù)通過可視的、交互的方式進行展示,從而形象、直觀地表達數(shù)據(jù)蘊含的信息和規(guī)律
圖形化報表:是報表的一種,也是數(shù)據(jù)可視化最常見的方法,通過一些圖表將數(shù)據(jù)更直觀的展示出來,將數(shù)據(jù)中關鍵的信息轉化成可快速獲得的易懂的信息
圖表的作用:(1)數(shù)據(jù)展示;(2)數(shù)據(jù)分析
圖表設計的步驟:
(1)明確問題;
(2)建立基本框架;
(3)將提供的信息轉換成明確的指標;
(4)確定圖表類型;
(5)突出關鍵信息;
圖表的標準:
(1)直觀易懂匹配需求;
(2)關鍵信息展示到位;
(3)圖表視覺效果良好;
(4)展現(xiàn)方式選擇合適
三、利用python進行數(shù)據(jù)分析
數(shù)據(jù)分析的基本步驟包括:
1、提出問題
2、理解數(shù)據(jù)
3、清洗數(shù)據(jù)
4、構建模型
5、數(shù)據(jù)可視化
01 一行代碼定義List
定義某種列表時,寫For 循環(huán)過于麻煩,幸運的是,Python有一種內(nèi)置的方法可以在一行代碼中解決這個問題。下面是使用For循環(huán)創(chuàng)建列表和用一行代碼創(chuàng)建列表的對比。
x = [1,2,3,4]
out = []
for item in x:
out.append(item**2)
print(out)
[1, 4, 9, 16]
# vs.
x = [1,2,3,4]
out = [item**2 for item in x]
print(out)
[1, 4, 9, 16]
02 Lambda表達式
厭倦了定義用不了幾次的函數(shù)?Lambda表達式是你的救星!Lambda表達式用于在Python中創(chuàng)建小型,一次性和匿名函數(shù)對象, 它能替你創(chuàng)建一個函數(shù)。
lambda表達式的基本語法是:
lambda arguments: expression
四、常見的分析模型
1、RFM模型
RFM 用于對用戶進行分類,并判斷每類細分用戶的價值。
三個關鍵指標:
最近一次消費時間(R):客戶距離最近的一次采購時間的間隔。
最近一段時間內(nèi)消費頻次(F):指客戶在限定的期間內(nèi)所購買的次數(shù)。
最近一段時間內(nèi)消費金額(M):客戶的消費能力,通常以客戶單次的平均消費金額作為衡量指標。
2、 帕累托分析
帕累托分析又叫 ABC 分析,分類的核心思想:少數(shù)項目貢獻了大部分價值。以款式和銷售量為例:A 款式數(shù)量占總體 10% ,卻貢獻了 80% 的銷售額。
把產(chǎn)品或業(yè)務分為A、B、 C三類,用于分清業(yè)務的重點和非重點,反映出每類產(chǎn)品的價值對庫存、銷售、成本等總價值的影響,從而實現(xiàn)差異化策略和管理。
3、 波士頓矩陣
波士頓矩陣通過銷售增長率(反映市場引力的指標)和市場占有率(反映企業(yè)實力的指標)來分析決定企業(yè)的產(chǎn)品結構。
4、轉化分析
轉化漏斗模型,是分析用戶使用某項業(yè)務時,經(jīng)過一系列步驟轉化效果的方法。
轉化分析可以分析多種業(yè)務場景下轉化和流失的情況,不僅找出產(chǎn)品潛在問題的位置,還可以定位每個環(huán)節(jié)流失用戶,進而定向營銷促轉化。