指數(shù)測算細(xì)節(jié)
1. 獲取歷年省級地方政府工作報告;
2. 中文分詞處理,分詞過程中考慮新質(zhì)生產(chǎn)力相關(guān)詞匯,并剔除常見停止詞;
4. 統(tǒng)計每個地區(qū)。每年的詞頻數(shù)據(jù),基于TF-IDF算法計算每個地區(qū)、每年、各詞TF-IDF值;
5. 將新質(zhì)生產(chǎn)力相關(guān)詞匯的TF-IDF值加總,得到各地區(qū)歷年新質(zhì)生產(chǎn)力政策強度指數(shù)。
關(guān)鍵詞
新質(zhì)生產(chǎn)力、人工智能、科技創(chuàng)新、技術(shù)革新、科學(xué)發(fā)展、創(chuàng)新動能、顛覆性技術(shù)、突破性技術(shù)、革命性創(chuàng)新、新技術(shù)、前沿技術(shù)、高新技術(shù)、尖端技術(shù)、新能源、新經(jīng)濟、數(shù)字經(jīng)濟、創(chuàng)新經(jīng)濟、未來經(jīng)濟、新業(yè)態(tài)、數(shù)字化轉(zhuǎn)型、產(chǎn)業(yè)升級、新模式、戰(zhàn)略性新興產(chǎn)業(yè)、未來產(chǎn)業(yè)、高科技產(chǎn)業(yè)、新動能產(chǎn)業(yè)、創(chuàng)新驅(qū)動技術(shù)驅(qū)動、創(chuàng)新引領(lǐng)、重大突破、提高生產(chǎn)力、質(zhì)的轉(zhuǎn)變、提升生產(chǎn)力、高效能、高性能、高效率、高產(chǎn)出、高質(zhì)量發(fā)展、質(zhì)量優(yōu)先、效益提升、高標(biāo)準(zhǔn)發(fā)展、主導(dǎo)技術(shù)、創(chuàng)新領(lǐng)先、科技引領(lǐng)、關(guān)鍵突破、核心技術(shù)突破
時間區(qū)間:2002-2024
數(shù)據(jù)文件說明
1. 省級np_data.xlsx
region:省份
year:年份
n:所有新質(zhì)生產(chǎn)力相關(guān)詞匯的詞頻和
tf_idf:所有新質(zhì)生產(chǎn)力相關(guān)的TF-IDF值之和(乘以10000),即新質(zhì)生產(chǎn)力政策強度指數(shù)
2. 省級np_words_freq&tf_idf.xlsx
value:關(guān)鍵詞(46個)
n:每個新質(zhì)生產(chǎn)力相關(guān)詞匯的詞頻
region:省份
year:年份
tf:每個新質(zhì)生產(chǎn)力相關(guān)詞匯的標(biāo)準(zhǔn)化詞頻
idf:每個新質(zhì)生產(chǎn)力相關(guān)詞匯的逆文檔頻率
tf_idf:每個新質(zhì)生產(chǎn)力相關(guān)詞匯的TF-IDF值