官术网_书友最值得收藏!

第2章 數據類型

通常機器學習操作的數據集可以看作數據對象的集合。數據對象有時也叫作記錄、點、向量、模式、事件、案例、樣本、觀測或實體。數據對象用一組刻畫對象基本特征的屬性描述,如物體質量、事件發生的時間等。屬性有時也叫作變量、字段、特征或維。在數學上,向量和矩陣可以用來表示數據對象及其屬性。

和其他機器學習語言或工具一樣,MADlib操作的基本對象也是向量與矩陣。在MADlib中,對向量和矩陣的操作是通過一系列函數完成的。

本章將介紹MADlib中向量和矩陣的概念,并舉出一些簡單的函數調用示例。用戶可以使用psql的聯機幫助查看函數的參數、返回值和函數體等信息,例如\df madlib.array_add或\df+ madlib.array_add。這里側重于應用,因為理解這些函數的意義和用法是使用MADlib進行機器學習的基礎。

主站蜘蛛池模板: 福建省| 静乐县| 平泉县| 安西县| 高陵县| 米泉市| 开阳县| 崇仁县| 山阴县| 清涧县| 安义县| 高碑店市| 吴忠市| 公主岭市| 金湖县| 利辛县| 甘肃省| 罗城| 梅河口市| 炉霍县| 舟山市| 儋州市| 沂源县| 衡阳市| 岳西县| 莆田市| 略阳县| 东丰县| 榆树市| 大洼县| 大城县| 将乐县| 建宁县| 濮阳市| 梁平县| 当雄县| 新津县| 伊川县| 新郑市| 利津县| 吕梁市|