官术网_书友最值得收藏!

數據部門如何All In AI

作者 丁香園資深數據架構 祝威廉

 

大數據部門的常見能力如下:

? 報表統計

? 算力/存儲輸出

? 推薦/搜索/精準營銷等傳統產品形態

通常,大數據部門會花費很大的力氣構建數據平臺,而這個數據平臺除了能讓研發、算法、分析師等角色爽一些,從宏觀角度很大地地節省部門人力成本、提高效率以外,似乎對公司/其他業務部門并無直接輸出。這也是很多大數據部門領導非常焦慮的地方。

那么出路在哪里呢?

All In AI

事實上,真正能幫助業務提高效能、提供創新產品的必然是AI。AI是一種模式的輸出,其價值點,第一個是可以給業務每個環節賦能,比如反垃圾可以減少審核同學的工作量,智能邀請可以減輕運營同學的工作壓力;第二個是創新產品,高一點的有比較常見有無人駕駛、智能語音產品、醫療診斷等,低一點的,則可能是某個具體的功能模塊對外輸出,比如知識圖譜。

從上面我們可以看到,數據部門的最大價值,最終會通過AI來落地,并且還會給部門/公司提供極為豐富的想象空間。

如何All In AI?

對于這件事情,我們要仔細研究一個核心的東西:資源。

資源我們又分為:

? 平臺資源,如果你還在刀耕火種階段做開發、做算法,那么咱也別談什么All in AI了。

? 人力資源,一場大型戰爭,核心還是在于看能動員的人力資源,面對海量需求,你是否有足夠的人力去應付?

? 組織資源,合理的組織是能夠極大地地釋放生產力的。

經過這么多年的發展,平臺已經很成熟了。我們知道,AI平臺是基于數據平臺的之上的,其結構是一個金字塔形狀的。所以第一步你需要有一個良好的數據平臺,其次你還需要有一個AI平臺,讓單一算法落地變得容易。

人力資源的問題是個大問題,算法團隊再大,也就是大數據部門一個子部門/組。如何在保持現有成本的情況下,擴大人力呢? AI平臺對單一算法(后面我會解釋什么是單一算法)問題是非常友好的,可能一個普通的工程師(甚至運營、分析師)都可以完成的。這樣,部門所有的人都具備了成為AI人力的潛能。我們通過一定的培訓和鍛煉,可以使得研發、分析等都具備成為AI人才的潛力。需要的時候,我們提純下即可。

回過頭來看看,什么是單一算法。所謂單一算法就是具體的某個算法問題,比如對于帖子的情感分類,就是一個標準的文本分類問題。通常一個足夠細化的問題,我們可以很容易將其轉化為一個分類、回歸、排序、規則類算法問題。現階段,按我的了解,AI平臺通常只能做到針對單一算法的自助化。那么為了讓組織更加合理高效,重構數據部門團隊就很有必要了。

算法部門需要切分成三個子團隊,一個是偏研究性質的,一個是偏業務性質的,還有一個則是AI平臺和工具團隊。

業務性質的團隊常常需要用到研究性質團隊的副產品以及基于AI平臺和工具團隊的產品之上進行工作,同時向他們反饋自己的訴求和問題。

業務算法團隊通常也需要分成兩個層級,一個是解決方案設計者,該角色是將一個實際的業務問題分拆成N個算法和工程問題;;一個是算法實施者,該角色只針對單一算法問題,可以在AI平臺上很快地地解決對應問題。

研究性質的團隊可以分成三個部分,一個是讀Paper,試圖將學術論文轉化為工業實踐;一個是算法基礎構建,維護比如知識圖譜這種非常底層的系統;一個是創新產品,目標是利用現有的算法抽象出新產品。

通過如上方法,有了很好的平臺能力,很好的人員基礎,加上合理的組織,All In AI或許變得可能。

總結

本文我們說了為什么要All In AI,要實現All In AI不僅僅需要有一個好的平臺(數據、算法平臺),也需要有良好的動員人力資源的能力,采用一個合理的算法組織架構充分利用人力資源。尤其是業務算法團隊里的“解決方案設計者”,該角色能夠將一個實際的業務問題分拆成N個算法和工程問題,是AI落地非常非常重要的一個角色。

主站蜘蛛池模板: 年辖:市辖区| 宜君县| 伊宁市| 和硕县| 秭归县| 丹阳市| 修文县| 渑池县| 金坛市| 梧州市| 珲春市| 大关县| 大港区| 贵溪市| 乐至县| 麦盖提县| 临江市| 临江市| 堆龙德庆县| 东源县| 璧山县| 锦屏县| 华池县| 桑植县| 临沭县| 诸暨市| 怀仁县| 屏东县| 奇台县| 丰都县| 湖北省| 苏尼特右旗| 马公市| 兴安盟| 肃宁县| 鹿泉市| 和平县| 吕梁市| 微博| 舟曲县| 阿拉善左旗|