第三節(jié)
機(jī)器學(xué)習(xí)工程師和機(jī)器學(xué)習(xí)規(guī)劃師會互相走近對方嗎?
在上一小節(jié)之中,我已經(jīng)敘述了當(dāng)前的背景。在這樣的背景之下,人工智能領(lǐng)域中的機(jī)器學(xué)習(xí)已經(jīng)進(jìn)入了幻滅期。對此,我們可以想出各種各樣的理由。例如,機(jī)器學(xué)習(xí)這門技術(shù)本身就是不好的;速成培養(yǎng)出來的人才其實(shí)沒有很好地掌握機(jī)器學(xué)習(xí)技術(shù)等,諸如此類。
企業(yè)在涉足機(jī)器學(xué)習(xí)領(lǐng)域之時,如果不能同時做到技術(shù)、人才兩手抓的話,那么首先應(yīng)該確保人才能夠走近技術(shù),理解技術(shù)。
誰應(yīng)該最先走近對方?
上文中我曾說到,與機(jī)器學(xué)習(xí)相關(guān)聯(lián)的職業(yè)有三種,并且我們已經(jīng)明確了這三種職業(yè)的不同職責(zé)。機(jī)器學(xué)習(xí)工程師是負(fù)責(zé)建機(jī)器學(xué)習(xí)模型的;機(jī)器學(xué)習(xí)規(guī)劃師則需要負(fù)責(zé)去考量建什么樣的模型才能夠給企業(yè)帶來收益。
如果機(jī)器學(xué)習(xí)規(guī)劃師和機(jī)器學(xué)習(xí)工程師相遇,那么這兩個負(fù)責(zé)不同板塊的人會發(fā)生以下對話。當(dāng)機(jī)器學(xué)習(xí)規(guī)劃師對有著商業(yè)敏感嗅覺的機(jī)器學(xué)習(xí)工程師說“我們現(xiàn)在有這些數(shù)據(jù),怎樣才能把它們用起來呢?”的時候,機(jī)器學(xué)習(xí)工程師就會回答說:“說到底,那些數(shù)據(jù)到底是做什么的呢?”或者“用這些數(shù)據(jù)是要解決什么課題嗎?它能夠給公司帶來多大的投資回報(bào)率呢?”
反過來也是如此。負(fù)責(zé)企劃的規(guī)劃師也要對編程有一些了解,比如“這些數(shù)據(jù)雖然量很大,但是其實(shí)質(zhì)量并不高,即便建模,想要拿出成果也難。”就像這樣,他們就會重新做出其他企劃,并選擇其中最可行的企劃來推進(jìn)項(xiàng)目。
然而,現(xiàn)實(shí)情況卻是,這些項(xiàng)目很少有進(jìn)展順利的。更多的情況則是,機(jī)器學(xué)習(xí)工程師和機(jī)器學(xué)習(xí)規(guī)劃師,以及機(jī)器學(xué)習(xí)項(xiàng)目團(tuán)隊(duì)當(dāng)中的人在交流的時候,都在說圖1-3那樣的“危險(xiǎn)語句”。而這些危險(xiǎn)語句無疑會招致PoC死這一必然的結(jié)局。
在這些危險(xiǎn)語句交織的情況之下,整個機(jī)器學(xué)習(xí)項(xiàng)目團(tuán)隊(duì)基本都會處于一種模糊的狀態(tài),并且無法掙脫出來。例如,“這么做應(yīng)該挺好的”“要是這樣的話就最好不過了”等,這些語句會讓周圍人都陷入不切實(shí)際的幻想之中,從而令項(xiàng)目遇到挫折甚至停擺。
要想避免這一結(jié)果,就需要我們避開這些危險(xiǎn)語句,積極去做能夠拿出成果的機(jī)器學(xué)習(xí)模型。那么在這個時候,機(jī)器學(xué)習(xí)工程師和機(jī)器學(xué)習(xí)規(guī)劃師應(yīng)該如何走近對方呢?當(dāng)然了,這兩者一起走近對方是最好不過的。但是如果硬要問哪一方先邁出第一步的話,那么本人認(rèn)為最好還是由負(fù)責(zé)企劃一方的機(jī)器學(xué)習(xí)規(guī)劃師率先邁出第一步。

圖1-3 誘發(fā)PoC死的項(xiàng)目危險(xiǎn)語句
考慮到機(jī)器學(xué)習(xí)工程師人才短缺……
由機(jī)器學(xué)習(xí)規(guī)劃師首先走近對方的理由有兩個。第一,機(jī)器學(xué)習(xí)技術(shù)沒有那么困難。為了打磨好企劃而所需要掌握的編程及數(shù)學(xué)知識,其實(shí)難度并沒有那么高。的確,如果你的目標(biāo)是開發(fā)出機(jī)器學(xué)習(xí)的新算法等,那么你就必須掌握微積分、行列式、概率統(tǒng)計(jì)等知識,而且對機(jī)器學(xué)習(xí)工程師來說,最好還要掌握編程和數(shù)學(xué)等理工科知識。然而對于一個機(jī)器學(xué)習(xí)規(guī)劃師來說,如果有人問:“要想打磨好一份企劃,需要掌握編程和數(shù)學(xué)知識嗎?”自然不是必須掌握的。在讀完本書所講解的機(jī)器學(xué)習(xí)知識之后,再了解一些深度學(xué)習(xí)的核心知識及長處、短處就是最好不過了。
第二,如今的工程師,尤其是軟件、機(jī)器學(xué)習(xí)的工程師處于供少求多的狀態(tài),因此即便他們不走近企劃一方,對他們的工作也不會造成任何不便。換言之,考慮到企業(yè)內(nèi)的現(xiàn)實(shí)狀況,刺激工程師一方主動走近企劃一方的誘因少之又少。在公司內(nèi)部,如果過度要求工程師一方走近企劃一方的話,反而會導(dǎo)致工程師跳槽到更加欣賞自己的其他公司里去[8]。
應(yīng)該將“商業(yè)投資回報(bào)率”納入視野之內(nèi)
與哪一方如何走近對方無關(guān),在涉足機(jī)器學(xué)習(xí)之際,最為重要的一個視角就在于“商業(yè)投資回報(bào)率”。這里所說的回報(bào)率視角,與后文中將要敘述的“七個規(guī)則”相關(guān)聯(lián)。這七個規(guī)則,聚焦在如何令投資回報(bào)率最大化之上,是人們整合了各式各樣的機(jī)器學(xué)習(xí)項(xiàng)目相關(guān)實(shí)例后整理出的共同要素。在投資如何獲得改善、課題如何才能得到解決、如何能夠賺錢等方面,商業(yè)投資回報(bào)率這一概念是最為重要的。本書將統(tǒng)一采取“投資回報(bào)率”這一用詞,并且對其進(jìn)行解釋說明。
試想一下,在一個機(jī)器學(xué)習(xí)項(xiàng)目中,分別有一個機(jī)器學(xué)習(xí)規(guī)劃師和一個機(jī)器學(xué)習(xí)工程師。假設(shè)機(jī)器學(xué)習(xí)工程師對商業(yè)有著靈敏的嗅覺,當(dāng)機(jī)器學(xué)習(xí)規(guī)劃師說“我們這里有這樣的數(shù)據(jù),但是輸入機(jī)器學(xué)習(xí)模型里卻不怎么好用”的時候,機(jī)器學(xué)習(xí)工程師就會回答說:“那如果解決了這個問題,預(yù)計(jì)會帶來多大的投資回報(bào)率呢?”進(jìn)而這兩人就會展開一番討論。
反過來也是如此。機(jī)器學(xué)習(xí)工程師會提出假說:“雖說數(shù)據(jù)成千上萬,數(shù)量是足夠多,但是質(zhì)量卻不太好,投資回報(bào)率也是。所以我們應(yīng)該重新選取數(shù)據(jù)。”接著雙方就開始進(jìn)行相應(yīng)的企劃。那么這個時候,機(jī)器學(xué)習(xí)規(guī)劃師就可以與預(yù)測出投資回報(bào)率的機(jī)器學(xué)習(xí)工程師對話,討論出需要的必要數(shù)據(jù)以及最新取得的成果等。
從經(jīng)濟(jì)價(jià)值的角度去考慮企業(yè)的投資回報(bào)率
談及企業(yè)的投資回報(bào)率,從經(jīng)濟(jì)價(jià)值的角度來考量的話應(yīng)該讓人更加容易理解。換句話說,投資回報(bào)率的基準(zhǔn),就是投資究竟能夠給企業(yè)貢獻(xiàn)多少利潤。這個時候就有兩種考慮方向。其一,就是通過提高給用戶的附加價(jià)值的方式來提高銷售額;其二,就是通過過程的改善而帶來成本的降低。
在機(jī)器學(xué)習(xí)項(xiàng)目當(dāng)中,如果機(jī)器學(xué)習(xí)模型不通過概念驗(yàn)證這一關(guān)的話,我們是無法知道模型的性能究竟如何的。另外,想必所有人都會認(rèn)為:只要是性能高的,就一定好。但是在性能這一點(diǎn)上,也有著各種各樣不同的指標(biāo)。
在機(jī)器學(xué)習(xí)的情況下,我們可以將我們所希望達(dá)到的性能與投資回報(bào)率合在一起進(jìn)行討論。打個比方,假如通過機(jī)器學(xué)習(xí)模型在大工廠進(jìn)行機(jī)器的故障檢測的話,就可以試算出目前的成本可以獲得的回報(bào)。“如果檢測的準(zhǔn)確率超過了99.9%的話,其準(zhǔn)確程度就相當(dāng)于超過了人類,就可以完全實(shí)現(xiàn)自動化了。這樣一來,一年就可以削減100人份的勞動力成本。如果一個人的平均年收入是500萬日元的話,那么總共省下來的錢就是5億日元。因此,即便企業(yè)為機(jī)器學(xué)習(xí)模型建模投資5億日元,也是能做到收支平衡的。”
通過理解投資回報(bào)率來加深討論
我們繼續(xù)用上面的故障檢測的例子來講解。如果加深了對機(jī)器學(xué)習(xí)的投資回報(bào)率的理解的話,企業(yè)內(nèi)部就會進(jìn)行這樣的討論:“準(zhǔn)確率到達(dá)99.9%是不可能的,但是達(dá)到98%卻不是不可能。”“以前做故障檢測都需要100個人。現(xiàn)在如果準(zhǔn)確率是98%的話,那只要50個人就可以應(yīng)付了。”
另外,再舉個檢測產(chǎn)品不合格率的例子。想必真正理解了的人之間會這樣邊進(jìn)行實(shí)證檢測邊討論:“假如近三年內(nèi),人們在進(jìn)行檢測的時候,合格產(chǎn)品自然直接通過放行,如果看到異樣的產(chǎn)品,檢測人員就會把它們挑出來進(jìn)行二次檢測。我們把所設(shè)定的性能目標(biāo)定為98%而不是99.9%。這樣一來,我們所需的投資額只要之前的一半,即2.5億日元即可。”“我們先把準(zhǔn)確率設(shè)定為90%。總之,我們是希望避免人們看漏不合格產(chǎn)品的情況。為此,我們就需要在機(jī)器學(xué)習(xí)中加入二次檢測來降低漏掉不合格產(chǎn)品的概率。即便只是做了這一件事,我們也可以減少客戶的投訴,提高產(chǎn)品的滿意度。”
然而直到今天,卻還是有很多實(shí)例表明,不少企業(yè)在不考慮投資回報(bào)率的情況下,就十分天真地認(rèn)為:只要用了機(jī)器學(xué)習(xí),準(zhǔn)確率肯定就能達(dá)到100%。而且他們在做出這樣的判斷之后,就開始開展項(xiàng)目。完美的人類是不存在的。同樣地,機(jī)器學(xué)習(xí)的準(zhǔn)確率也不可能達(dá)到100%。真實(shí)情況就是,企業(yè)在不考慮投資回報(bào)率和性能二者之間的關(guān)系的情況下,就貿(mào)然進(jìn)行企劃、討論,甚至開始將機(jī)器學(xué)習(xí)模型投入實(shí)際應(yīng)用的話,是無法獲得成功的。
- 客戶成功經(jīng)濟(jì):為什么商業(yè)模式需要全方位轉(zhuǎn)換
- 數(shù)據(jù)思維:讓大腦更清醒(套裝共4冊)
- 商業(yè)就是這樣:不可不知的商業(yè)常識
- 財(cái)富從哪來
- 創(chuàng)業(yè)!創(chuàng)業(yè)!創(chuàng)業(yè)改變命運(yùn)的5堂課
- 一口氣讀懂經(jīng)濟(jì)學(xué)
- 城市物流碳排放與低碳發(fā)展政策研究
- 供給側(cè)結(jié)構(gòu)性改革與政府職能轉(zhuǎn)變問題研究(谷臻小簡·AI導(dǎo)讀版)
- 生活中不可不知的經(jīng)濟(jì)學(xué)常識
- 扶貧濟(jì)困的保險(xiǎn)
- 牛奶可樂經(jīng)濟(jì)學(xué)(完整版)
- 循環(huán)式增長:企業(yè)如何在萬物智聯(lián)時代持續(xù)盈利
- 面向21世紀(jì)海上絲綢之路的中國與東盟海洋合作研究
- 創(chuàng)新創(chuàng)業(yè)基礎(chǔ)
- 經(jīng)濟(jì)常識一本全