用SAS? R? Python?不會(huì)不想不愿編碼腫么破?
幸運(yùn)的小編在11月13-16號參加了李御璽老師的數(shù)據(jù)挖掘課程!
李老師的課程有什么好? 不用編碼,點(diǎn)點(diǎn)鼠標(biāo),分分鐘搞定數(shù)據(jù)挖掘。
SPSS MODELER就是這樣,簡單的操作;干凈的界面;專業(yè)的數(shù)據(jù)挖掘軟件!
...
數(shù)據(jù)挖掘?qū)嵨锛癕ODELER應(yīng)用培訓(xùn),并有十個(gè)案例(囊括各個(gè)行業(yè))穿插在課程講解中,您值得擁有!
以下為小編聽了李老師的課程,并參照了《基于Clementine的數(shù)據(jù)挖掘》,將書上的一個(gè)小例子展現(xiàn)給大家
1.案例數(shù)據(jù)為一份關(guān)于藥物研究的數(shù)據(jù);加型N疾病的不同病人,服用五種藥物中的一種(drugA、drugB...)后,都取得了同樣的治療效果;現(xiàn)在需要利用數(shù)據(jù)挖掘技術(shù)發(fā)現(xiàn)以往藥物處方適用的規(guī)律,對于不同特征(血壓、膽固醇、鈉鉀含量等)的病人給予更適合哪種藥物的建議。(數(shù)據(jù)在附件中)
2.觀察各個(gè)變量的數(shù)據(jù)特征:可以看到MODELER對此計(jì)算除了最小值、最大值、均值、標(biāo)準(zhǔn)差、偏態(tài)系數(shù)等基本描述統(tǒng)計(jì),同時(shí)還輸出了數(shù)值型變量的直方圖以及分類型變量的柱形圖。
3.通過散點(diǎn)圖反應(yīng)服用不同藥物的病人鈉鉀含量指標(biāo); 圖形顯示服用drugY的病人,其唾液中的K含量明顯低于其他類病人,由此可見,單純K含量較低的病人選用drugY比較理想。
4.通過直方圖反應(yīng)鈉鉀濃度指標(biāo)(Na/K)與服用對應(yīng)藥物的關(guān)系。圖形顯示,對于Na/K比值處在高水平的病人,drugY是理想的選擇。
5.通過網(wǎng)狀圖反映不同血壓特征病人的藥物選擇。圖中線條粗細(xì)反映病人的BP與選用drug的情況。可以看到,無論血壓狀況如何,都可以服用drugY。
6.通過建立模型C5.0,從年齡 性別 血壓 鈉鉀濃度指標(biāo)的綜合角度分析選擇不同藥物的依據(jù)。 根據(jù)圖形顯示,可以看出:Na/K比值是選擇藥物的首要考慮因素,其次是血壓、年齡、和膽固醇水平。其中性別對藥物選擇沒有影響。
學(xué)藝不精,各位見諒!