第二節
屢屢遇PoC死,多數的人都陷入了幻滅
所謂PoC,就是指試行項目制作完成之后,進入試運行的狀態,中文譯名為概念驗證。然而,許多機器學習模型都在概念驗證過程中被終結,根本無法進入實際操作的階段。所以就出現了“PoC死”這一極富揶揄意味的詞語。
為什么會屢屢發生PoC死呢?
那么,為什么機器學習項目一到概念驗證這一階段就很容易失敗呢?讓我們先從機器學習的誕生到試運行環節,按照順序認真地看一看吧。首先,將數據組成機器學習模型。我們已經在前一節中明確過,所謂機器學習,就是運用計算機從數據中來自動獲取規律的技術。在這里,我們把這些被獲取的規律稱為機器學習模型(ML MODEL)。
如果想要實際確認這個已經建好的機器學習模型性能的話,就要對其進行實證分析,從而確認這一模型是否達到了可以投入實際應用的水平。這就是概念驗證的目的所在。因此,在概念驗證這一關,沒有人能夠保證,處在試運行環節的機器學習模型是否能夠達到大家想要的效果。概念驗證這一過程,其實不過就是以“多產多死”為大前提。而事實上,類似的例子也的確很多,甚至不絕于耳。在實際的應用當中,人們是根本不可能做到百發百中的。失敗是與成功相伴而行的。換句話說,機器學習模型進入概念驗證階段后,再也無法往前推進了的這一狀態,就是所謂的PoC死。
當然了,作為一門技術,機器學習的歷史尚淺,所以機器學習在商業方面獲得成功的模式還沒有真正建立起來,PoC死的概率相對較高其實也是理所當然的。然而,如果親眼看了各式各樣的機器學習項目,我們就會發現,有很多項目的失敗,其實是通往成功路上必經的失敗。遇到這樣的失敗,我們就可以高呼:“很好,再試一次!”但是,還有一些失敗似乎是根本就不應該去嘗試的。所以,當我們開始分析導致這“不必要的失敗”的原因時,就可以得出像圖1-2那樣的幾個共同要素。也有很多人認為:說到底,即便不進行概念驗證這個過程也沒關系,有的企劃想要挑戰的那些事情,其實一看就是機器學習解決不了的事。所以,策劃出這種企劃,企業本身就有很大的問題。

這樣說來,不是人工智能相關的內容,也無法得到改善嗎?
曾經有一段時期,只要一個東西帶上人工智能這四個字,它的期待值就會倍增。最近,人們對人工智能的期待值有所降低。然而事實卻是,即便是現在,也有很多人在根本沒有理解人工智能是什么的情況下,就對它報以盲目的期待,甚至認為只要用了人工智能就什么問題都能解決。
其實,PoC死實例眾多的一個主要原因,就是人們明明不知道機器學習能否解決這個問題,就盲目挑戰(難度高的)項目。另外,有許多人做的企劃都是一些即便解決了也沒有實際意義的課題,而且他們還從這種企劃出發,試圖做出機器學習模型。除此之外,還有很多人讓機器學習模型去對接的企劃,其實根本就不需要機器學習的加入。
你做的企劃,是不是過于“依賴數據”呢?
其實,“依賴數據的企劃”很容易招致PoC死的結果。有很多相似的實例都是企業在還沒有明確商業投資回報率或最終目標的情況下,就模模糊糊地開始討論、做規劃:“總之我們有大量的數據。先用這個數據,再做個機器學習模型什么的試試看。要是順利的話,說不定就能解決掉那些一直令我們煩惱的問題……”
打個比方,假設一家公司里有100萬條銷售信息、顧客信息等相關的網頁登錄記錄,有工作人員提議將這些數據輸入機器學習模型里,將這些數據當作新的銷售信息來靈活使用。如果其他職員認為這個提案別出心裁的話,那么這個提案就被繼續做下去了。
接下來,機器學習工程師得知了這個項目之后,很有可能處于一種迷迷糊糊的狀況,不知道該如何將機器學習運用到商業領域之中。如果機器學習工程師沒有明確這個提案所要求的成果,甚至帶著困惑的心情,抱著“總之先試著做一做”的想法的話,那么最終得出來的結果一定會與企業最初所預期的成果大相徑庭。最終的結果就是這個提案不得不從頭開始做。
在沒有機器學習規劃師的情況下,僅僅依賴于數據而突然進行企劃的話,無疑會招致幻滅期的來臨。到最后,一定會有人出來說:“唉,什么機器學習啊,不過如此,根本就不是什么了不起的東西。”