作者:郭娟 ITValue / 日期:2015-12-14
ITValue注:通過大數據來針對用戶進行畫像分類,這早已是電商平臺們常用的手段了,而優化用戶體驗、提升物流速度、向用戶精準推薦商品,這些技術的實現也都往往需要靠大數據挖掘能力。
在2015鈦媒體T-EDGE峰會上,京東集團的首席技術顧問翁志詳細講述了大數據在京東的應用,并且翁志透露,刷單行為也可以通過數據的分析分割出來,后臺對這個數據進行剝離,讓刷單變得更慢,更無效。
1,大數據構造京東用戶畫像。對于用戶,每個人都有自己的基本屬性,購買能力、行為方式,還有他的社交網絡和社會中的角色,心理特征、興趣愛好,這些數據都可以用這些特性,都可以標識出來,用多達300個的標識刻畫出人物畫像并進行歸類。并且基于此,可以進行一些有針對性的計算和有針對性的促銷。
2,根據用戶畫像,建立小區模型。在中國,用戶的住宅小區通常是根據價格檔次進行分類的,根據這點可以判斷這個小區的總體行為應該是相似的群體,以此來預測小區居民的消費行為,并進行提前調倉和儲備貨物,來進行物流速度的提升。
3,個性化推薦。這是大數據最直接的體現,首先京東對用戶進行畫像,同時對商品進行分類。其次,在商品和用戶之間建立關聯,再加上一些其他的維度,包括時間的維度、用戶的購買能力等相關聯,然后就可以計算出這個用戶在什么時候需要什么樣的產品。
4,京東慧眼,用用戶的行為來影響產品的生產。基于大數據模式,對用戶需求進行一個細致的分析,通過預測用戶需求來倒逼傳統企業生產方。
以下是翁志在2015鈦媒體T-EDGE峰會上的演講實錄,經ITValue編輯:
京東的數據應用中,包括很多產品,有京東慧眼,有精密機器人,用戶畫像,商品畫像,每一個產品的背后都是用數據來驅動的,比如JIMI機器人,后面語音的處理,文字的分割,文字的語義的分析,我們用到深度記憶學習的方式來完成,這里可能沒有的還有我們對圖片的分析,圖片的識別,他后面是用到叫做CNN、RNN的方式,也是一種神經網絡來進行處理,這些都是大數據背后一些算法的實現。
如何發揮京東大數據的優勢和價值?
首先我講一下京東的用戶畫像,對于用戶,每個人都有自己的基本屬性,購買能力、行為方式,還有他的社交網絡和社會中的角色,心理特征、興趣愛好,這些數據都可以用這些特性,都可以標識出來,對于用戶的畫像我們可以用多達300多個標識來進行一個標注,把這些信息組織起來,我們就可以清晰的了解一個人的行為方式,比如說這個人是屬于哪個年齡段,他的星座是什么,體型是什么,身高是什么,可以把這群人進行一個歸類。同時也把他的相歸于我們的個性化服務注入到個性的特征當中去。
這就是用戶分群的一個方式,比如說這個人是崇尚智能設備的,我們就可以用技術達人來給他分類,這個人買東西他是會找到最好的價格,我們可能就是一個網購高手,他家庭是否買小孩的東西,他可能屬于有孩一族、數碼潮人,有家有室,我們可以貼出標簽,我們也可以看出很多有趣的行為來。
比如說他每次訪問京東是通過一些網吧來訪問的,我可能就知道,他是用計算機來訪問的,他訪問的是web界面,他可能沒有用家里的計算機,如果他在家里訪問,通過高速上網他白天應該沒有時間的,都是在晚上進行操作的,他如果在公司里上網我們可以知道他一定的行為,我們可以把用戶分成不同的類型。性格上都可以進行分類,可以幫助我們進行有目的的促銷,有目的的推送他所需要的產品。
大家看到,通過一系列的計算,我們就可以把用戶的行為進行一個有效的分類,基于這個基礎,就可以進行一些有針對性的計算和有針對性的促銷,比如說我們在做用email促銷的時候叫EDN,我們做了一個比較,在我沒有用數據分析方式來做的時候,普通用戶的打開率是較低的,而且15天的轉化率,銷售轉化率也不是很好,但是我們在用了數據分析的方式,在針對性的進行促銷的話,我們的email打開率就提升了,而且我們15天的銷售額也有一個有效的增長。
在個人用戶畫像的基礎之上,我們怎么建立一個用戶的小區模型?因為在中國的城鄉市場,大家的住宅小區是根據價格檔次進行分類的,根據這點可以判斷這個小區的總體行為應該是相似的群體,這種有效的分類可以幫助我們什么呢?例如預測小區的消費行為和他們偏好的產品,需要的產品,這些預測行為可以幫我們提前把用戶需要的產品前置到京東的前置倉去,我們產品不是放在離用戶最近的地方,這樣成本會很高。
如果基于小區畫像,例如要進行iPhone的促銷,我們就可以把預定的iPhone預置在小區附近的倉庫里,這樣網頁上一發布的商品可能在十分鐘后,十分鐘以后您下完單,二十分鐘以后我們就可以進行快速的配送,這些高效率的送貨行為都是基于我們把我們的產品已經在預先分配好在不同的站點的基礎上完成的。
大數據產品最直接、最簡單的應用應該是個性化推薦。在我們的網頁當中,我們對一個消費者有多達幾十種推薦的產品,后臺會猜你喜歡哪種商品,需要哪些商品。還有郵件的推薦,他推薦的產品幫助我們把用戶需要的商品推送給最有潛力去買的用戶的前端。我們怎樣做到個性推薦的呢?
首先京東對用戶進行畫像,包括我剛剛說的這些屬性會進行一個分類,對于一個商品我們也會進行商品的分類,因為商品的分類可以讓我們可以更好的為用戶進行商品推薦。其次,在商品和用戶之間建立關聯,再加上一些其他的維度,包括時間的維度、用戶的購買能力等相關聯,我們就可以計算出這個用戶在什么時候需要什么樣的產品。
最后給大家介紹一個京東大數據應用的產品:京東慧眼。普通的流程是我們通過用戶行為分析用戶購買產品的一個能力和他的方式,來給用戶推薦產品,但是我們發現很多情況下我們需要用用戶的行為來影響產品的生產,所以我們可以把他變成一個商戶的行為。
傳統的B2C的模式,用戶有他的需求,生產廠商進行生產,出來產品,但是有了我們大數據的模式以后,對用戶的需求會進行一個細致的分析,因為用戶當時的需求不一定是他生產出后來,有一個周期的,是幾個月之后的需求,所以對這個需求我們會進行一個預測,進行一個分析,這樣的話甚至是一個量化的分析,出來的生產就會是有目的的,有針對性的進行生產,這樣的產品應該是更符合用戶需求的,比如新加了一些功能,比如說我們價格定位可以在生產環節當中就會進行一些調整,這樣出來的產品就會對用戶來說應該是更滿足他的需求的。
農村電商,我們不僅擁有高大上的,高端用戶,我們還沒有忘記更多的我們的農村用戶,農村用戶是我們現在一個開拓我們市場的一個具有戰略性的一個項目,京東平臺通過我們的這些用戶行為,用戶這些大數據的分析,我們可以用他來指點我們農民兄弟如何進行農業的生產,同時我們也可以根據當時的地利和當時的天氣條件指導他們應該做什么樣的生產,如果產品生產多了,第二年應該用什么樣的方式進行彌補或者是進行轉產,這就變成了一個生態圈,我們給農民兄弟提供了一套幫助他、指導他進行有序的、合理的生產方式,而且他生產出來的產品需要是什么樣的,更符合用戶的需求,這我們都會進行一個很合理的分析,這個數據出來以后,就可以用他來幫助我們農業生產者進行一個有針對性的生產,而且他們的產品也會找到銷路,這樣一整套的流程就是可以幫助極大的提升農業產品在流通環節當中的地位。
所以大家可以看到,大數據在京東的電商里占著非常非常重要的地位,他不僅通過各種各樣的行為分析來了解用戶,同時也幫助我們的商家進行一個有效的生產,我們用大數據把我們的前端和后端都有序的連接起來。(文/郭娟,本文根據翁志在2015鈦媒體T-EDGE峰會上的演講全文整理)