五月天婷亚洲天久久综合网,婷婷丁香五月激情亚洲综合,久久男人精品女人,麻豆91在线播放

  • <center id="8gusu"></center><rt id="8gusu"></rt>
    <menu id="8gusu"><small id="8gusu"></small></menu>
  • <dd id="8gusu"><s id="8gusu"></s></dd>
    樓主: davil2000
    50843 148

    [原創(chuàng)博文] 大數(shù)據(jù)時(shí)代BI王者之劍——SAS企業(yè)挖掘系統(tǒng)   [推廣有獎(jiǎng)]

    • 1關(guān)注
    • 粉絲

    院士

    99%

    還不是VIP/貴賓

    -

    TA的文庫  其他...

    ☆大數(shù)據(jù)時(shí)代文庫☆

    威望
    4 級(jí)
    論壇幣
    29700 個(gè)
    通用積分
    23.9404
    學(xué)術(shù)水平
    1172 點(diǎn)
    熱心指數(shù)
    1121 點(diǎn)
    信用等級(jí)
    1143 點(diǎn)
    經(jīng)驗(yàn)
    97526 點(diǎn)
    帖子
    2730
    精華
    19
    在線時(shí)間
    3003 小時(shí)
    注冊時(shí)間
    2004-10-31
    最后登錄
    2022-6-10

    樓主
    davil2000 發(fā)表于 2012-12-9 20:14:40 |只看作者 |壇友微信交流群|倒序 |AI寫論文
    相似文件 換一批

    +2 論壇幣
    k人 參與回答

    經(jīng)管之家送您一份

    應(yīng)屆畢業(yè)生專屬福利!

    求職就業(yè)群
    趙安豆老師微信:zhaoandou666

    經(jīng)管之家聯(lián)合CDA

    送您一個(gè)全額獎(jiǎng)學(xué)金名額~ !

    感謝您參與論壇問題回答

    經(jīng)管之家送您兩個(gè)論壇幣!

    +2 論壇幣
        數(shù)據(jù)已滲透到當(dāng)今每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。人們對于海量數(shù)據(jù)的挖掘和運(yùn)用,預(yù)示著新一波生產(chǎn)率增長和消費(fèi)者盈余浪潮的到來------麥肯錫咨詢

       
    大數(shù)據(jù)的爆炸式增長在大容量、多樣性和高增速方面,全面考驗(yàn)著現(xiàn)代企業(yè)的數(shù)據(jù)處理和分析能力;同時(shí),也為企業(yè)帶來了獲取更豐富、更深入和更準(zhǔn)確地洞察市場行為的大量機(jī)會(huì)。對企業(yè)而言,能夠從大數(shù)據(jù)中獲得全新價(jià)值的消息是令人振奮的。然而,如何從大數(shù)據(jù)中發(fā)掘出“真金白銀”則是一個(gè)現(xiàn)實(shí)的挑戰(zhàn)。這就要求采用一套全新的、對企業(yè)決策具有深遠(yuǎn)影響的解決方案。

        SAS企業(yè)挖掘系統(tǒng)(SAS/Enterprise Miner)廣泛應(yīng)用于解決欺詐偵測、雇員流動(dòng)、客戶獲取與維持、網(wǎng)絡(luò)銷售、市場細(xì)分、風(fēng)險(xiǎn)分析、親和性分析、客戶滿意度、破產(chǎn)預(yù)測和投資組合分析等多樣化問題。根據(jù)大數(shù)據(jù)時(shí)代的企業(yè)挖掘的特征,SAS INSTITUTE提出了數(shù)據(jù)挖掘的SEMMA方法論——在SAS/EM環(huán)境中,數(shù)據(jù)挖掘過程被劃分為Sample、Explore、Modify、Model、Assess這五個(gè)階段,簡記為SEMMA:
    1.Sample 抽取一些代表性的樣本數(shù)據(jù)集(通常為訓(xùn)練集、驗(yàn)證集和測試集)。樣本容量的選擇標(biāo)準(zhǔn)為:包含足夠的重要信息,同時(shí)也要便于分析操作。該步驟涉及的處理工具為:數(shù)據(jù)導(dǎo)入、合并、粘貼、過濾以及統(tǒng)計(jì)抽樣方法。
    2.Explore 通過考察關(guān)聯(lián)性、趨勢性以及異常值的方式來探索數(shù)據(jù),增進(jìn)對于數(shù)據(jù)的認(rèn)識(shí)。該步驟涉及的工具為:統(tǒng)計(jì)報(bào)告、視圖探索、變量選擇以及變量聚類等方法。
    3.Modify 以模型選擇為目標(biāo),通過創(chuàng)建、選擇以及轉(zhuǎn)換變量的方式來修改數(shù)據(jù)集。該步驟涉及工具為:變量轉(zhuǎn)換、缺失處理、重新編碼以及數(shù)據(jù)分箱等。
    4.Model 為了獲得可靠的預(yù)測結(jié)果,我們需要借助于分析工具來訓(xùn)練統(tǒng)計(jì)模型或者機(jī)器學(xué)習(xí)模型。該步驟涉及技術(shù)為:線性及邏輯回歸、決策樹、神經(jīng)網(wǎng)絡(luò)、偏最小二乘法、LARS及LASSO、K近鄰法以及其他用戶(包括非SAS用戶)的模型算法。
    5.Assess 評估數(shù)據(jù)挖掘結(jié)果的有效性和可靠性。涉及技術(shù)為:比較模型及計(jì)算新的擬合統(tǒng)計(jì)量、臨界分析、決策支持、報(bào)告生成、評分代碼管理等。數(shù)據(jù)挖掘者可能不會(huì)使用全部SEMMA分析步驟。然而,在獲得滿意結(jié)果之前,可能需要多次重復(fù)其中部分或者全部步驟。

        在完成SEMMA步驟后,可將從優(yōu)選模型中獲取的評分公式應(yīng)用于(可能不含目標(biāo)變量的)新數(shù)據(jù)。將優(yōu)選公式應(yīng)用于新數(shù)據(jù),這是大多數(shù)數(shù)據(jù)挖掘問題的目標(biāo)。此外,先進(jìn)的可視化工具使得用戶能在多維直方圖中快速、輕松地查閱大量數(shù)據(jù)并以圖形化方式比較模擬結(jié)果。SAS/EM包括了一些非同尋常的工具,比如:能用來產(chǎn)生數(shù)據(jù)挖掘流程圖的完整評分代碼(SAS、C以及Java代碼)的工具,以及交換式進(jìn)行新數(shù)據(jù)評分計(jì)算和考察執(zhí)行結(jié)果的工具。

        如果您將優(yōu)選模型注冊進(jìn)入SAS元數(shù)據(jù)服務(wù)器,便可以讓SAS/EG和SAS/DI Studio的用戶分享您的模型,從而將優(yōu)選模型的評分代碼整合進(jìn)入工作報(bào)告和生產(chǎn)流程之中。SAS模型管理系統(tǒng),通過提供了開發(fā)、測試和生產(chǎn)系列環(huán)境的項(xiàng)目管理結(jié)構(gòu),進(jìn)一步補(bǔ)充了數(shù)據(jù)挖掘過程,實(shí)現(xiàn)了與SAS/EM的無縫聯(lián)接。

        在SAS/EM環(huán)境中,您可以從SEMMA工具欄上拖放節(jié)點(diǎn)進(jìn)入工作區(qū)的工藝流程圖中,這種流程圖驅(qū)動(dòng)著整個(gè)數(shù)據(jù)挖掘過程。SAS/EM的圖形用戶界面(GUI)是按照這樣的思路來設(shè)計(jì)的:一方面,掌握少量統(tǒng)計(jì)知識(shí)的商務(wù)分析者可以瀏覽數(shù)據(jù)挖掘過程的技術(shù)方法;另一方面,具備數(shù)量分析技術(shù)的專家可以微調(diào)方式深入探索每一個(gè)分析節(jié)點(diǎn)。
    Ass.png
        SAS/EM使得評分過程實(shí)現(xiàn)了自動(dòng)化,并提供模型開發(fā)所有階段的完整代碼(SAS、C、Java和PMML)。評分代碼可以部署在在SAS系統(tǒng)、互聯(lián)網(wǎng)或者關(guān)系數(shù)據(jù)庫等實(shí)時(shí)或批處理環(huán)境中。
          SAS/EM視頻鏈接:   http://www.tudou.com/programs/view/NHisFCskxAE/
                                    http://v.youku.com/v_show/id_XNDg2MTA1Mjg4.html

        大數(shù)據(jù)時(shí)代的企業(yè)需要基于海量數(shù)據(jù)進(jìn)行探索和分析,以發(fā)現(xiàn)有意義的商務(wù)行為模式和規(guī)則。在商務(wù)智能領(lǐng)域,SAS Institute的產(chǎn)品憑其卓越性能足以傲視群雄,企業(yè)挖掘系統(tǒng)則如同具有精靈魔力的王者之劍,令尊貴的企業(yè)用戶愛不釋手。SAS/EM具備了一系列適于大數(shù)據(jù)挖掘的顯著特征:(1)內(nèi)涵豐富的SEMMA工具箱、(2)基于元數(shù)據(jù)理念的精確建模技術(shù)、(3)友好的、流程圖式的數(shù)據(jù)挖掘模式、(4)獨(dú)具特色的數(shù)據(jù)處理、存儲(chǔ)、分析、呈現(xiàn)及共享方式。這些特征均使得商務(wù)挖掘過程能夠以簡練、流暢而高效的方式順利進(jìn)行。
       

    二維碼

    掃碼加我 拉你入群

    請注明:姓名-公司-職位

    以便審核進(jìn)群資格,未注明則拒絕

    關(guān)鍵詞:大數(shù)據(jù)時(shí)代 大數(shù)據(jù) Enterprise Institute programs SAS 企業(yè) 挖掘 大數(shù)據(jù) 數(shù)據(jù)挖掘

    回帖推薦

    remeva 發(fā)表于70樓  查看完整內(nèi)容

    軟件這東西,哪有啥高端不高端,只是用用戶的使用習(xí)慣不一樣。覺得很多數(shù)據(jù)處理也不需要SAS,其他軟件也可以勝任,比如R

    complicated 發(fā)表于47樓  查看完整內(nèi)容

    頂LZ,全面系統(tǒng)的介紹了SEMMA方法論和SAS/EM。也分享一下跟SPSS MODELER的比較: 我覺得,在用戶友好方面,SPSS始終領(lǐng)先一步;可是真要干活的話,還是要用SAS。 比如前陣子做關(guān)聯(lián)規(guī)則挖掘,上千萬條的時(shí)候,MODELER根本不行了,跑一晚上然后給我報(bào)錯(cuò)。被逼無奈改用SAS,雖然也得幾個(gè)小時(shí),但是真出貨呀。關(guān)聯(lián)規(guī)則挖掘這類項(xiàng)目,你不太可能先做sampling,這不是統(tǒng)計(jì)分析,這數(shù)據(jù)挖掘,就是要遍歷全部數(shù)據(jù)才能找到規(guī)律的。 最后一 ...

    ziyenano 發(fā)表于30樓  查看完整內(nèi)容

    EM沒用過,不過我覺著,其中算法的核心大多是proc的一些東西吧。 公司一直用的正版IBM SPSS Modeler(前身就是SPSS clementine), 不得不說其簡潔性的操作,對SAS產(chǎn)生了極大的沖擊; 里面的提供的算法也不少,但用了這么久,對其中一些算法的效率存在很大的質(zhì)疑, 前陣子,對一個(gè)一百多萬的數(shù)據(jù),進(jìn)行了logistic回歸,苦等了8個(gè)多小時(shí),卻一直沒結(jié)果; 無奈之下,停了模型,換成SAS操作,也就15分鐘的事情; 再者SVM,幫助說明 ...

    webgu 發(fā)表于25樓  查看完整內(nèi)容

    比較麻煩的是帶EM模塊的SAS 對大部分人來說,較難獲得。剛接觸SAS時(shí),始于統(tǒng)計(jì)的PROC,后來到BASE,macro,sql. 對于EM,感覺離我還是比較遠(yuǎn)。隨著big data 噱頭的興起, 以后可能會(huì)有越來越多的人關(guān)注吧。

    數(shù)據(jù)分析師3K 發(fā)表于8樓  查看完整內(nèi)容

    SAS/EM功能異常強(qiáng)大 普通的商務(wù)分析人員能用菜單點(diǎn)擊方式加以運(yùn)用 有編程技術(shù)的還可通過設(shè)計(jì)新節(jié)點(diǎn)來挖掘該產(chǎn)品的潛能

    Crsky7 發(fā)表于18樓  查看完整內(nèi)容

    徹底進(jìn)入大數(shù)據(jù)時(shí)代,灰色系統(tǒng)模型已經(jīng)被淘汰。
    已有 12 人評分經(jīng)驗(yàn) 論壇幣 學(xué)術(shù)水平 熱心指數(shù) 信用等級(jí) 收起 理由
    李會(huì)超 + 40 精彩帖子
    詹姆斯 + 1 精彩帖子
    ljflyz + 1 + 1 + 1 時(shí)尚
    liujianfang + 100 好的意見建議
    xsfh3000 + 1 + 1 + 1 精彩帖子
    有福有德 + 100 + 100 + 5 + 5 好資料
    擁抱大海的魚 + 1 + 1 + 1 獎(jiǎng)勵(lì)積極上傳好的資料
    瀚海星云 + 1 + 1 + 1 感謝分享
    大數(shù)據(jù)之魂 + 100 + 5 + 5 + 5 精彩帖子
    資料狂人 + 5 對論壇有貢獻(xiàn)

    總評分: 經(jīng)驗(yàn) + 440  論壇幣 + 200  學(xué)術(shù)水平 + 28  熱心指數(shù) + 24  信用等級(jí) + 29   查看全部評分

    本帖被以下文庫推薦

    R是萬能的,SAS是不可戰(zhàn)勝的!
    SAS/EM功能異常強(qiáng)大
    普通的商務(wù)分析人員能用菜單點(diǎn)擊方式加以運(yùn)用
    有編程技術(shù)的還可通過設(shè)計(jì)新節(jié)點(diǎn)來挖掘該產(chǎn)品的潛能
    藤椅
    yangz98 發(fā)表于 2012-12-10 10:15:15 |只看作者 |壇友微信交流群
    davil老師,能不能解決一下連接里面的問題,謝謝。!
    http://xalimeijing.com/forum.php? ... amp;from^^uid=3066508
    關(guān)于技術(shù)的帖子遠(yuǎn)不及娛樂的受關(guān)注
    論壇需要一批專業(yè)壇友增強(qiáng)學(xué)習(xí)氛圍
    報(bào)紙
    擁抱大海的魚 發(fā)表于 2012-12-10 10:29:04 |只看作者 |壇友微信交流群
    雖然看不懂,但也支持!希望發(fā)揚(yáng)光大
    地板
    hdzwjing 發(fā)表于 2012-12-10 10:59:45 |只看作者 |壇友微信交流群
    有機(jī)會(huì)學(xué)習(xí)下
    經(jīng)濟(jì)引導(dǎo)生活
    7
    hengchao919 發(fā)表于 2012-12-10 11:00:12 |只看作者 |壇友微信交流群
    SAS, 確實(shí)好,就是搞不到破解版的
    8
    wwwdz63 發(fā)表于 2012-12-10 11:01:25 |只看作者 |壇友微信交流群
    sas是不錯(cuò),可是軟件太貴了
    9
    Toyotomi 在職認(rèn)證  發(fā)表于 2012-12-10 12:50:09 |只看作者 |壇友微信交流群
    這個(gè)軟件,我之前曾經(jīng)在我現(xiàn)在學(xué)校的圖書館中看過它的介紹,有別於其它版本的SAS。我也覺得,謝謝您﹗
    I am looking for a talent scout who may appreciate me...

    >>>>>>>生產(chǎn)和運(yùn)營管理<<<<<<<
    10
    天堂之路 發(fā)表于 2012-12-10 13:15:24 |只看作者 |壇友微信交流群
    可以學(xué)習(xí)一下哈
    您需要登錄后才可以回帖 登錄 | 我要注冊

    本版微信群
    加好友,備注cda
    拉您進(jìn)交流群

    京ICP備16021002-2號(hào) 京B2-20170662號(hào) 京公網(wǎng)安備 11010802022788號(hào) 論壇法律顧問:王進(jìn)律師 知識(shí)產(chǎn)權(quán)保護(hù)聲明   免責(zé)及隱私聲明

    GMT+8, 2024-12-23 17:17