官术网_书友最值得收藏!

技術對于商業影響加深


問答環節:希拉里·梅森

AI如何融入數據科學團隊

HOW AI FITS INTO YOUR DATA SCIENCE TEAM

了解商業、產品數據科學和研發能力——這三件數據科學家做的事,會讓你受益匪淺。

里克·布林約爾松和安德魯·麥卡菲在大思路中指出,AI和機器學習(ML)將很快成為重要性不亞于電力和內燃機的通用技術。兩者代表我們技術能力的里程碑式轉折,將帶動下一波經濟增長。

但我們如何應用AI和機器學習呢?組織中哪些部門適合發展這些新能力?公司該如何利用AI和機器學習?

為了解到切實可靠的說法,《哈佛商業評論》英文版高級編輯沃爾特·弗里克(Walter Frick)采訪了機器智能研究公司Fast Forward 實驗室的創始人希拉里·梅森(Hilary Mason)。以下為兩人對話節選。

HBR:AI是現在的大熱話題。你作為數據科學家和研究人員,如何看待你所在領域近期出現的進步?

梅森:如果我們8年或10年以前談到這個問題,我可能會說是大數據,然后討論我們是否可以建立一個基礎架構,把所有數據放在一起并進行數據查詢。建好基礎架構,你就可以應用分析法,也就是通過計算,回答有商業價值或產品價值的問題。人們一直都可以使用數據計算,但大概8年前出現的轉變是,新型軟件降低了計算成本,讓廣大沒有經驗的人也可進行數據計算。

于是數據科學開始興起;該學科主要涉及敏捷計算、預測,以及根據數據建模。現在數據科學建模成本已經大幅度降低,所以該技術不僅應用于一些重要問題上(如精算),還用來做推薦、搜索結果等看似微不足道的小事。

后來我們有了機器學習——數據科學中幫你敏捷計算、引入反饋環的工具。我們開始用模型從外界獲取更多數據,將數據反饋給這些模型,促進模型進一步升級。

如今我們都在談AI。這個詞本身意義就有些含糊,既有技術上的含義,也有市場營銷方面的解釋,但本質上是講如何利用機器學習(確切地說是深度學習)驅動基于機器學習的應用軟件。也就是說,要使用AI,就必須有機器學習;要使用機器學習,就必須有分析法;要使用分析法,就必須有數據基礎架構。這就是我對上述技術之間聯系的看法。

機器學習和AI如何融入公司既有數據能力中呢?

數據科學在組織中有很多方面的應用。我看到人們在管理數據科學時,經常將這類技術與其搭載的技術組合混為一談。但我會將數據科學分解為基于同一技術的三種能力。第一種能力是了解商業,即分析法或者說商業智能通過問問題和分析信息做出更明智決定。通常使用這種能力的是首席財務官(CFO)或首席運營官(COO),應用范圍不限于技術領域。

第二種能力是產品數據科學,即創建使用機器學習和AI的算法和系統,實現真正意義上的產品升級。具體實例包括垃圾郵件過濾器、推薦系統、搜索算法和數據可視化工具。產品研發或工程部門通常會使用這類能力,應用領域比較單一。

最后一種數據能力是研發能力,也就是使用數據發掘新產品、新業務和新收入機會,但這種能力往往被忽視,或者被當成產品數據科學。

機器學習和AI將這三種能力都改變了嗎?

我們現在花點時間,深入探討一下深度學習,因為深度學習對所謂的AI來說,重要性不言而喻,而且也是近年來機器學習所取得進步的關鍵因素。首先,深度學習讓過去任何分析都獲取不到的數據變得觸手可得——你現在可以發掘視頻和音頻數據的價值。當前擁有海量數據的公司數量依然有限,但我認為將來這類公司會越來越多。分析法現在也受圖像數據使用能力的影響,單純的文本或結構性數據重要性降低。其次,深度學習幫助人們找到解決文本摘要等數據科學難題的新方法,創建質量和精密度遠高于過去的預測模型,還增強了產品的數據科學功能,因為深度學習能夠帶來新的產品機會。比如現在有幾家公司通過使用深度學習,在電子商務推薦系統中取得很大成功。當然深度學習正在盡最大技術可能拓展新領域,從而影響到研發職能。

所以數據科學與分析法、產品開發和研發職能相關。公司是要“一步一個腳印”地發展,還是從這三方面同時發力?

兩者都有吧。如果你只從一方面發力,就會錯失其他機會。但你最好不要急急忙忙著手研發,在此之前還是要夯實基礎架構和分析法的基礎。實際上我們發現,人們更愿意在投資新收入機會前,先投資節約成本的項目。這樣做在文化上比較容易讓人接受。

你認為公司在發展數據科學能力上,還犯了哪些錯誤?

其中一個大錯出在流程方面。我們發現,人們強行把數據科學融入到軟件工程流程中,最后毫無成效。數據科學系統的開發在很多方面與其他流程截然不同。做數據科學項目時,你從一開始就不知道最后能不能成功。但做軟件工程項目的話,你從一開始就知道最后能成功。

這說明軟件工程流程在遇到不確定因素的情況下會失敗,而數據科學的實驗流程需要有不確定因素才能成功。

此外,每家公司都有自己要克服的文化障礙。很多公司都不會讓你在不可能成功的項目上耗費時間,所以選擇高風險研究項目的數據科學家即便取得成績,也非常有可能因連續兩個月看不到工作回報,而在年度評估中受到處罰。數據科學的發展要求有包容失敗的文化環境。公司須認識到,所投項目組合中有些最終會有回報,而且帶來的價值遠比漸進式產品升級高。

現在大家對這個話題眾說紛紜,你如何去蕪存菁?高管又該怎樣做到這一點呢?

我依然對現在所謂“AI”的潛力持樂觀態度,但在某種意義上我也是個實用主義者——我需要創建對客戶有用的系統,而這就是很大的限制因素。目前有些人到處大放厥詞。幾年前,我們稱之為回歸分析的東西現在稱作AI,而用這個說法僅僅是為了從市場營銷角度抬高其價值。所以我建議,記住AI不是魔法。在概念層面上,高管完全可以理解AI。如果有人向你推銷某個觀點,稱“我不想解釋工作原理,這就是AI”,你一定要不停追問其工作原理、輸入數據類型、系統會學習數據中哪些模式、輸出結果是什么。深度學習系統的結果一般就是之前未被標記的數據點,而現在這些數據有了標簽和可靠度評估,僅此而已。機器的智能不是你我所擁有的智能。恐怕我們還要走上很長一段路,才能見證到機器擁有人類的智能。

主站蜘蛛池模板: 梁河县| 方山县| 十堰市| 宜昌市| 横峰县| 阳城县| 淳化县| 如东县| 武山县| 石狮市| 化隆| 三台县| 萝北县| 灌阳县| 肇州县| 商河县| 德阳市| 芜湖县| 水城县| 和田市| 南汇区| 威海市| 新田县| 本溪| 莱阳市| 许昌市| 怀集县| 岳池县| 家居| 东阳市| 车致| 襄垣县| 奉化市| 黄浦区| 南雄市| 浦北县| 通城县| 焦作市| 崇明县| 永昌县| 江门市|