幸福感數(shù)據(jù)分析軟件
2025-01-14 20:23:20 來源:本站原創(chuàng) 瀏覽:4次該預(yù)測模型采用了cs架構(gòu)的方式開發(fā),主要是通過python語言開發(fā),pyqt方式設(shè)計(jì)界面,數(shù)據(jù)庫方面采用了mysql數(shù)據(jù)庫進(jìn)行管理,從數(shù)據(jù)選取,數(shù)據(jù)分析,異常處理,特征相關(guān)性分析等進(jìn)行數(shù)據(jù)的分析,通過數(shù)據(jù)的分析,推斷出人們的幸福感,以便獲取人們的幸福指數(shù)。該平臺可以通過以下幾個(gè)部分,進(jìn)行數(shù)據(jù)的檢測分析:
讀取原始數(shù)據(jù):數(shù)據(jù)是通過爬蟲從城市的數(shù)據(jù)網(wǎng)站爬取數(shù)據(jù),獲取各項(xiàng)數(shù)值,并讀取到系統(tǒng)中,以數(shù)據(jù)列表的形式展示出來。
異常數(shù)據(jù)檢查:主要對缺失值進(jìn)行排查檢測,分為三項(xiàng),特征名,缺失值總數(shù),以及百分比,通過異常數(shù)據(jù)的分析,對數(shù)據(jù)的整體進(jìn)行篩查檢測,并且列出百分比,方便檢測。
異常值處理:對缺失比例小于15%的數(shù)據(jù)進(jìn)行刪除,并且可以使用眾數(shù)填充其他的缺失值。
特征相關(guān)性分析:主要是分析特征,選取前20個(gè)重要的特征學(xué)習(xí),得到特征的相關(guān)矩陣圖像,以圖像形式展示出來。
模型建立與預(yù)測:可以利用預(yù)先訓(xùn)練好的模型對測試數(shù)據(jù)進(jìn)行預(yù)測,并且可以對預(yù)測的結(jié)果進(jìn)行展示,分為兩列,一列是數(shù)據(jù)的id值,代表某行數(shù)據(jù)信息,另外一列是幸福指數(shù)值,也就是百分比,數(shù)值越大,幸福指數(shù)越大。