五月天婷亚洲天久久综合网,婷婷丁香五月激情亚洲综合,久久男人精品女人,麻豆91在线播放

  • <center id="8gusu"></center><rt id="8gusu"></rt>
    <menu id="8gusu"><small id="8gusu"></small></menu>
  • <dd id="8gusu"><s id="8gusu"></s></dd>
    樓主: 匿名
    6427 9

    [Stata] Stata基礎操作:數據管理(二) [推廣有獎]

    匿名網友
    樓主
    匿名網友  發(fā)表于 2015-9-24 20:15:50 |壇友微信交流群|倒序 |AI寫論文
    相似文件 換一批

    +2 論壇幣
    k人 參與回答

    經管之家送您一份

    應屆畢業(yè)生專屬福利!

    求職就業(yè)群
    趙安豆老師微信:zhaoandou666

    經管之家聯合CDA

    送您一個全額獎學金名額~ !

    感謝您參與論壇問題回答

    經管之家送您兩個論壇幣!

    +2 論壇幣

    Stata基礎操作:數據管理(二)

    Stata WorkShop2:Data Management

    Chang Y. Chung

    Princeton University

    /*在當前工作路徑下建立dm文件夾并進入*/
    1. cap findfile dm
    2. if "`r(filename)'" == "" mkdir dm
    3. cd dm
    復制代碼
    /*下載數據、解壓、進入解壓包*/
    1. copy "https://codeload.github.com/Chang-Y-Chung/dm/zip/master" "dm-master.zip"
    2. unzipfile "dm-master.zip", replace
    3. cd dm-master
    復制代碼
    /*顯示自帶及部分下載數據集*/
    1. sysuse dir,all
    復制代碼
    /*Some Variables from auto.dta*/

    1. sysuse auto, clear
    2. describe make price mpg foreign
    復制代碼

    1.PNG




    /*tabulate(含標簽)*/
    1. sysuse auto, clear
    2. tabulate foreign
    復制代碼

    2.PNG


    /*tabulate(不含標簽)*/
    1. sysuse auto, clear
    2. tabulate foreign, nolabel
    復制代碼

    3.PNG


    /*summarize*/
    1. sysuse auto, clear
    2. summarize price mpg
    復制代碼

    4.PNG


    /*其它一些有用的命令*/
    1. sysuse auto, clear
    2. describe make mpg price
    3. inspect make mpg price
    4. codebook make mpg price
    復制代碼
    /* 輸出到EXCEL-export excel與import excel 為Stata12新增*/
    1. sysuse auto, clear
    2. keep make price foreign
    3. keep in 1/5
    4. export excel using auto.xls, replace first(var)
    5. !start auto.xls // windows
    6. /* !open auto.xls // mac */
    復制代碼

    xls.png


    /*輸入EXCEL文件中的數據*/
    1. import excel using auto.xls, clear firstrow
    2. describe
    復制代碼

    7.PNG

    菜單操作:File------>Import--------->EXCEL spreadsheet(*.xls,*.xlsx)

    /*常見數據集的處理情形*/

    appendMerge.png



    /*Append 舉例*/
    1. /*奇數集*/
    2. use http://www.stata-press.com/data/r13/odd1.dta, clear
    3. keep in 1/3
    4. list
    5. save odd.dta, replace
    復制代碼

    6.PNG


    1. /*偶數集*/
    2. clear all
    3. input number even odd
    4. 4 10 .
    5. 5 12 .
    6. end
    7. list
    8. save even.dta, replace
    復制代碼

    9.PNG


    1. /*將偶數集追加到奇數集中*/
    2. use odd.dta, clear
    3. append using even.dta, generate(obsFrom)
    4. list
    復制代碼

    10.PNG


    1. /*關于Append追加 */
    2. 語法: append using filename [, options]
    3. 將硬盤中的副數據集(即上式using后的數據集)添加到內存中的數據集(主數據集)

    4. 1.新的主數據集添加更多觀測值
    5. 2.變量間的匹配的依照變量名(而不是變量序號)
    6. 3.沒有的變量也會以缺失值代替
    復制代碼
    /*Merge 舉例*/

    merge.png


    1. cd dm-master   // 解壓文件夾為dm-master
    2. use age, clear // 主數據集
    3. merge 1:1 id using weight, report
    4. save ageWeight, replace
    復制代碼

    merge.JPG

    1. input region  x
    2.       1   15
    3.       2   13
    4.       3   12
    5.       4   11   
    6. end
    7. save z,replace
    8. clear all
    9. input id  region  a
    10.            1    2  26
    11.            2    1  29
    12.            3    2  22
    13.            4    3  21
    14.            5    1  24
    15.            6    5  20
    16. end
    17. merge m:1 region using z ,report keepusing(region x)
    18. sort id,stable               
    19. browse
    復制代碼
    /*關于merge(橫向)*/
    1. 句法:merge 1:1 varlist using "using file name", report或者merge m:1 varlist using "using file name", report
    2. 依照主/副數據集相同變量加以橫向合并,
    3. 主數據集中的數據是不可更改,將一同出現在新數據集
    4. 默認情況下會自動產生一個含以下序號的_merge變量,意義分別為:
    5. 序號1-指master-代表該值僅存在于主數據集
    6. 序號2-指using-代表該值僅存在于副數據集
    7. 序號3-指master-代表該值同時存在于副數據集和主數據集
    復制代碼
    /*數據輸入*/
    infile:
    1. infile str14 country setting effort change using test.raw, clear
    2. list in 1/3
    復制代碼

    11.PNG


    1. /*自由文本格式Free-format*/:
    2. 1.指每個變量的值均以空格/Tab/逗號分開
    3. 2.如果嵌入空格或逗號,那么字符數據值會加引號
    4. 3.如果不同觀測值已經以行劃分開,應考慮使用import delimited(自Stata13起取代insheet)
    復制代碼
    1. /*固定格式文本數據:Fixed Column Format*/
    2. //固定格式指每個變量的值均在固定的列,有時需要用字典文件(.dct)加以描述
    3. //輸入:以test.raw為例
    4. infile using test.dct, clear
    5. //查看:
    6. type test.dct
    復制代碼

    dictionary.png

    testRaw.png


    注:固定與自由格式是ASCII格式的兩種分類

    1.png


    1. *expand:拓展數據,以下述韋恩圖的繪制為例,將整理后的數據集中的每一類觀測值按(freq頻數倍)復制,還原為初始數據集
    2. //Venn diagram using venndiag 維恩圖
    3. ssc install venndiag
    4. clear
    5. input hayfever  eczema  freq
    6. 1        0      31088
    7. 1        1      9863
    8. 0        1     43522
    9. 0        1       9258
    10. 0        0     35299
    11. 1        0     11024
    12. 1        1     6200
    13. 0        0     345262
    14. end
    15. list
    16. expand freq
    17. venndiag hayfever  eczema
    復制代碼

    expandCollapse.png


    1. *collapse——建立包含描述性統計結果的數據集
    2. sysuse auto
    3. gen lprice=ln(price)
    4. collapse(max) max_lprice=lprice max_mpg=mpg ///
    5.         (iqr) iqr_lprice=lprice iqr_mpg=mpg ///
    6.          if !missing(rep78) ,by(rep78)         
    7. sort rep78
    8. list
    9. save 1.dta,replace  //保存
    10. /*將lprice 和mpg 的最大值和四分位間距(iqr)提取出,命名為max_lprice/max_mpg/iqr_mpg/iqr_lprice.
    11. 注:四分位間距:即上四分位數與下四分位數之間的差值,四分位數越大,說明數據離散程度越大*/
    復制代碼
    1. *contract_生成包含百分數與頻數的數據集

    2. sysuse auto
    3. contract rep78 foreign //也可附加freq()選項以對頻數變量命名,默認為_freq
    4. list,sep(0)

    5. //轉換為原數據
    6. expand _freq  //按上述默認的頻數變量值倍還原
    復制代碼

    crossJoinby.png

    1. /*joinby--->m:m 多對多合并*/
    2. /*務必對關鍵變量family-ID加以排序*/
    3. webuse set http://www.stata-press.com/data/dmus

    4. webuse parname
    5. sort famid
    6. save parnamesort

    7. webuse kidname
    8. sort famid
    9. save kidnamesort

    10. use parnamesort
    11. joinby famid using kidnamesort
    復制代碼
    1. /*cross   ------->一一交叉
    2. 可用于數據集間不同變量相互交叉組合的可能性分析,因此兩個數據集中的變量名最好不同,如下為4*4組合*/
    3. webuse set http://www.stata-press.com/data/dmus
    4. webuse moms1
    5. list
    6. save moms1,replace
    7. webuse dads1
    8. list
    9. save dads1,replace
    10. webuse moms1
    11. cross using dads1
    12. list
    復制代碼

    reshape.png

    1. // Reshaping long to wide
    2. webuse set  http://www.stata-press.com/data/dmus
    3. webuse cardio_long
    4. describe
    5. list in 1/10
    6. reshape wide bp pl, i(id) j (trial)
    7. reshape long
    8. *Data management using Stata Page 258
    復制代碼
    1. // Reshaping long to wide
    2. webuse set  http://www.stata-press.com/data/dmus
    3. webuse cardio_wide
    4. describe
    5. reshape long bp pl, i(id) j(trialnum)
    6. reshape wide
    復制代碼
    二維碼

    掃碼加我 拉你入群

    請注明:姓名-公司-職位

    以便審核進群資格,未注明則拒絕

    關鍵詞:Stata基礎 Stata 基礎操作 tata 數據管理 富陽

    已有 2 人評分經驗 論壇幣 學術水平 熱心指數 信用等級 收起 理由
    我的素質低 + 100 + 100 + 5 + 5 + 5 精彩帖子
    xddlovejiao1314 + 100 + 100 + 5 + 5 + 5 精彩帖子

    總評分: 經驗 + 200  論壇幣 + 200  學術水平 + 10  熱心指數 + 10  信用等級 + 10   查看全部評分

    本帖被以下文庫推薦

    沙發(fā)
    rrjj101022 發(fā)表于 2015-9-24 20:30:32 |只看作者 |壇友微信交流群
    謝謝分享~~~
    已有 2 人評分經驗 論壇幣 熱心指數 收起 理由
    xddlovejiao1314 + 10 + 3 鼓勵積極發(fā)帖討論
    niuniuyiwan + 10 + 1 熱心幫助其他會員

    總評分: 經驗 + 10  論壇幣 + 13  熱心指數 + 1   查看全部評分

    藤椅
    lwzxy 發(fā)表于 2015-9-24 20:47:15 |只看作者 |壇友微信交流群
    謝謝分享
    已有 2 人評分經驗 論壇幣 熱心指數 收起 理由
    xddlovejiao1314 + 10 + 3 鼓勵積極發(fā)帖討論
    niuniuyiwan + 10 + 1 鼓勵積極發(fā)帖討論

    總評分: 經驗 + 10  論壇幣 + 13  熱心指數 + 1   查看全部評分

    板凳
    xddlovejiao1314 學生認證  發(fā)表于 2015-9-24 21:27:10 |只看作者 |壇友微信交流群
    好貼,謝謝分享。
    已有 2 人評分經驗 論壇幣 學術水平 熱心指數 信用等級 收起 理由
    niuniuyiwan + 100 + 10 精彩帖子
    我的素質低 + 5 + 5 + 5 精彩帖子

    總評分: 經驗 + 100  論壇幣 + 10  學術水平 + 5  熱心指數 + 5  信用等級 + 5   查看全部評分

    報紙
    niuniuyiwan 在職認證  發(fā)表于 2015-9-25 08:56:35 |只看作者 |壇友微信交流群
    xddlovejiao1314 發(fā)表于 2015-9-24 21:27
    好貼,謝謝分享。
    感謝師兄,真誠到永遠!
    已有 1 人評分學術水平 熱心指數 信用等級 收起 理由
    我的素質低 + 5 + 5 + 5 精彩帖子

    總評分: 學術水平 + 5  熱心指數 + 5  信用等級 + 5   查看全部評分

    地板
    我的素質低 學生認證  發(fā)表于 2015-9-25 08:58:02 |只看作者 |壇友微信交流群
    niuniuyiwan 發(fā)表于 2015-9-25 08:56
    感謝師兄,真誠到永遠!
      
    已有 1 人評分論壇幣 熱心指數 收起 理由
    niuniuyiwan + 10 + 5 觀點有啟發(fā)

    總評分: 論壇幣 + 10  熱心指數 + 5   查看全部評分

    7
    shajia2008 在職認證  發(fā)表于 2015-10-5 16:30:44 |只看作者 |壇友微信交流群
    謝謝分享!
    已有 1 人評分經驗 論壇幣 熱心指數 收起 理由
    niuniuyiwan + 100 + 10 + 1 精彩帖子

    總評分: 經驗 + 100  論壇幣 + 10  熱心指數 + 1   查看全部評分

    8
    我家滴草莓 發(fā)表于 2015-10-5 23:42:28 |只看作者 |壇友微信交流群
    很詳細啊,受教了!謝謝!
    已有 1 人評分經驗 論壇幣 熱心指數 收起 理由
    niuniuyiwan + 100 + 10 + 1 精彩帖子

    總評分: 經驗 + 100  論壇幣 + 10  熱心指數 + 1   查看全部評分

    9
    楚天江南客 學生認證  發(fā)表于 2017-6-28 15:20:14 |只看作者 |壇友微信交流群
    stata中字典文件是怎么創(chuàng)立的?
    10
    安寧 發(fā)表于 2017-8-18 11:32:19 |只看作者 |壇友微信交流群
    好貼,謝謝分享
    您需要登錄后才可以回帖 登錄 | 我要注冊

    本版微信群
    加好友,備注jltj
    拉您入交流群

    京ICP備16021002-2號 京B2-20170662號 京公網安備 11010802022788號 論壇法律顧問:王進律師 知識產權保護聲明   免責及隱私聲明

    GMT+8, 2024-12-23 05:53