基于機器學習的數據缺失值填補:理論與方法
這是一部講解如何基于機器學習技術實現數據缺失值填補的專著,與傳統的基于統計學的缺失值填補方法相比,效率上得到了較大的提升。作者基于多年的研究和實踐成果,創新性地提出了基于神經網絡的缺失值填補方法和基于TS模型的缺失值填補方法。全書共8章,可分為4個部分。第一部分(第1~3章):首先介紹缺失值填補領域的缺失數據機制、基本概念、性能度量等基礎知識,隨后詳細闡述目前基于統計學、機器學習的缺失值填補理論與方法。第二部分(第4~5章):對目前神經網絡在缺失值填補領域的研究成果進行歸納總結,并從網絡模型、填補方案角度闡述神經網絡填補方法的設計及應用。第三部分(第6~7章):詳細介紹面向不完整數據的TS建模過程,隨后通過特征選擇算法處理TS建模中的特征冗余問題,并從前提參數優化和結論參數優化兩個角度改進TS模型。第四部分(第8章):以缺失值填補方法在我國貧困問題研究中的應用為例,展現缺失值填補方法的現實意義。
·16.6萬字