提起京東,人們經(jīng)常會(huì )想到頻出的新聞、引發(fā)關(guān)注和熱議,實(shí)際上,技術(shù)才是京東取得長(cháng)足發(fā)展的引擎,從搜索到個(gè)性化頁(yè)面,再到對消費者行為的畫(huà)像,都有大數據和算法在后面支撐,而每次大促更像一個(gè)時(shí)間節點(diǎn),這些用戶(hù)體驗在之前都被一一梳理。來(lái)看鈦媒體記者郭娟對于京東技術(shù)的解剖報道:
對于京東的5000名技術(shù)人員來(lái)說(shuō),618和Hackathon(編程馬拉松)都是重要的經(jīng)歷:618與其說(shuō)是一次銷(xiāo)售的狂歡,不如說(shuō)是京東的一場(chǎng)技術(shù)大考;Hackathon強化了技術(shù)人員在互聯(lián)網(wǎng)時(shí)代做研發(fā)的思維方式:快速迭代。
“618對京東更意味著(zhù)系統的全面梳理和升級,以及更有效的團隊協(xié)作和人才培養機會(huì )。”京東集團高級副總裁張晨這樣總結。今年年初“空降”京東的張晨,曾經(jīng)在互聯(lián)網(wǎng)領(lǐng)域縱橫多年,但此前一直沒(méi)有在電商企業(yè)工作過(guò),對首次參與618的評價(jià)是:震撼!但同時(shí)又像在看一場(chǎng)精彩的電影。
此前,京東技術(shù)團隊為了備戰618,經(jīng)過(guò)了7次備戰例會(huì )及上百次各類(lèi)專(zhuān)題會(huì )、預案評審會(huì )……這些準備化解了618當天的壓力,以致于許多技術(shù)人員在當天同時(shí)參與到搶購活動(dòng)中。京東表示,即使遇到光纜忽然中斷這樣的極端情況,他們也有備案:跨機房多活、流量入口轉移、應用系統的跨機房切換、有效的限流和降級等機制,以此來(lái)保證用戶(hù)體驗。
在經(jīng)歷了早期的“救火”、中期的驅動(dòng)業(yè)務(wù)發(fā)展,未來(lái)將引領(lǐng)企業(yè)成長(cháng),技術(shù)在京東的定位已經(jīng)越來(lái)越清晰,張晨認為:“好比一道乘法題,技術(shù)作為系數的話(huà),要爭取到1以上。”
新聞頻出的背后,京東還有一張安靜的技術(shù)面孔
(京東集團高級副總裁張晨)
“千人千面”背后的技術(shù)
作為國內最大的自營(yíng)式電商平臺,在京東購物,從搜索到個(gè)性化頁(yè)面,再到對消費者行為的畫(huà)像,都有技術(shù)、大數據和算法在后面支撐,技術(shù)已經(jīng)呈現出“乘法效應”,而每次大促更像一個(gè)時(shí)間節點(diǎn),這些用戶(hù)體驗在之前都被一一梳理。
傳統零售千人一個(gè)店面,電商在未來(lái)卻可以做到千人千面,618大促前,京東在“今日推薦”和“猜你喜歡”兩個(gè)欄目上實(shí)現了千人千面。此前,在京東上購物的每一個(gè)消費者的用戶(hù)行為都有數據化的軌跡,這些軌跡從長(cháng)遠來(lái)看可以讓電商企業(yè)了解到用戶(hù)需求,京東的做法是,消費者畫(huà)像以家庭為單位,張晨透露:“家庭畫(huà)像比個(gè)人畫(huà)像更有價(jià)值,家庭畫(huà)像也可以囊括個(gè)人。”
假如一個(gè)消費者長(cháng)期購買(mǎi)的商品只與自己相關(guān),系統可以判斷他(她)的狀態(tài)是單身,但是某個(gè)消費者不僅買(mǎi)老人的商品,也買(mǎi)男性的商品,還買(mǎi)小孩的奶粉尿布,這就可以把該賬戶(hù)定義為家庭賬戶(hù),在商品推送的相關(guān)性上,增加了很多維度。例如一個(gè)消費者愛(ài)買(mǎi)漂亮小女童的裙子,可以算出她有一個(gè)幾歲的女兒,判斷她的女兒可能需要的玩具、鞋子、生活消費等,有相關(guān)的打折商品出現時(shí)進(jìn)行推送,消費者購買(mǎi)的概率就會(huì )更高。
張晨總結,推送的算法并非今日買(mǎi)了一瓶礦泉水,明天就推送純凈水,而是基于消費場(chǎng)景來(lái)做,系統大致知道一個(gè)消費者在某個(gè)階段需要什么商品,又有相關(guān)商品的大促,這個(gè)時(shí)候建立關(guān)聯(lián),會(huì )讓轉化率提高很多倍,“這些信息是對消費者有效的、有用的,能真正為用戶(hù)創(chuàng )造價(jià)值”。
據了解,“千人千面”在技術(shù)實(shí)現上很像娛樂(lè )節目的選拔,首先從海選開(kāi)始,此時(shí)所用的數據模型為“召回模型”,分為購買(mǎi)行為、瀏覽行為、用戶(hù)偏好、地域屬性等維度進(jìn)行。首先是基于購買(mǎi)行為的召回,例如,某用戶(hù)購買(mǎi)了Kindle,模型就會(huì )推薦一個(gè)Kindle的保護套,這是基于購買(mǎi)的搭配;基于瀏覽行為的召回,例如,最近股市很火,某用戶(hù)最近瀏覽金融類(lèi)的入門(mén)書(shū)籍比較多,模型就會(huì )推薦一些炒股類(lèi)的書(shū)籍;再次,基于用戶(hù)偏好的召回,比如某用戶(hù)喜歡服飾箱包、喜歡GUCCI品牌、喜歡BB霜等,該用戶(hù)的畫(huà)像為女性、職業(yè)為銷(xiāo)售經(jīng)理等,購買(mǎi)力中等偏上,就會(huì )根據用戶(hù)的偏好進(jìn)行針對性召回;最后,基于用戶(hù)地域的召回,例如,北京用戶(hù)在選擇白酒時(shí),會(huì )非常傾向于二鍋頭,山西用戶(hù)會(huì )優(yōu)先選擇汾酒,而四川用戶(hù)更青睞瀘州老窖等品牌。
經(jīng)過(guò)“海選”后,便進(jìn)入“總決賽”。京東有許多算法模型,如在線(xiàn)相關(guān),在線(xiàn)相似,離線(xiàn)相關(guān),離線(xiàn)相似,近期比較熱銷(xiāo)的品牌和品類(lèi)、基于用戶(hù)實(shí)時(shí)行為建立的一些模型,京東發(fā)現,將所有的模型組合在一起,總體效率是最高。在這諸多的算法后面也有考核指標,例如轉化率、點(diǎn)擊率、GMV等等,以每周推出7~8個(gè)算法的速度迭代,推動(dòng)更優(yōu)算法的出現。
京東技術(shù)團隊經(jīng)過(guò)跟蹤發(fā)現,把用戶(hù)“近期關(guān)注的商品”和“最近點(diǎn)擊的商品”作為兩個(gè)模型加入進(jìn)去,整體轉發(fā)率較之原算法提升了100%左右。后又把用戶(hù)“放入購物車(chē)的商品”作為另外一個(gè)模型加入,整體績(jì)效又能提升5%~10%。
在京東,技術(shù)與業(yè)務(wù)結合的乘法效應初顯。
跟進(jìn)互聯(lián)網(wǎng)時(shí)代
除了技術(shù)與業(yè)務(wù)結合,京東的技術(shù)人員在改變思維方式,跟進(jìn)互聯(lián)網(wǎng)時(shí)代。618后不久,京東首次舉辦了Hackathon大賽,這是一個(gè)流行于美國IT圈的活動(dòng),中文的意思是“編程馬拉松”,由很多程序員聚集在一起,在短時(shí)間里協(xié)作編程。在張晨的眼里,京東的技術(shù)人員有兩個(gè)經(jīng)歷必不可少:一是像618這樣的大促,另一個(gè)就是編程馬拉松大賽。
此次,京東的Hackathon大賽讓技術(shù)人員封閉三天,編寫(xiě)像酒店、旅游這樣的互聯(lián)網(wǎng)產(chǎn)品,在自營(yíng)式電商的各個(gè)產(chǎn)品線(xiàn)已經(jīng)很成熟的情況下,新興出現的上門(mén)服務(wù)、O2O這樣的產(chǎn)品需要更多的創(chuàng )新產(chǎn)品出來(lái)。京東首次Hackathon大賽的比賽結果便是在優(yōu)勝劣汰中輸出這樣的產(chǎn)品。Hackathon大賽預先將編程人員分為若干組,每組配有產(chǎn)品經(jīng)理,在做出一個(gè)產(chǎn)品前,編程人員、產(chǎn)品經(jīng)理、架構師與業(yè)務(wù)人員預先溝通,產(chǎn)品經(jīng)理設計產(chǎn)品,最后通過(guò)程序實(shí)現。張晨認為,那種幾年寫(xiě)出一個(gè)軟件的時(shí)代已經(jīng)過(guò)去,互聯(lián)網(wǎng)時(shí)代的產(chǎn)品是有了想法就要用互聯(lián)網(wǎng)的速度快速實(shí)現,先做出something,再通過(guò)各種反饋來(lái)完善產(chǎn)品,實(shí)現快速迭代。
“Hackathon改變的是技術(shù)人員的思維方式,讓他們不再去閉門(mén)造車(chē),而是在線(xiàn)上得到改進(jìn)的方向,貼近用戶(hù),吸收他們的建議到產(chǎn)品中來(lái),體現了用戶(hù)導向的原則”,張晨這樣總結。此外,Hackathon的活動(dòng)會(huì )讓技術(shù)極客凸顯出來(lái),在技術(shù)人員這個(gè)群體中,對于“技術(shù)大牛”有一種天生崇拜之情,京東要營(yíng)造的是一種開(kāi)放、透明、分享,同時(shí)又讓技術(shù)人員有方向的技術(shù)氛圍。
從一定意義上來(lái)說(shuō),電商企業(yè)也是互聯(lián)網(wǎng)企業(yè),它的技術(shù)從一開(kāi)始就體現了互聯(lián)網(wǎng)的方式。京東技術(shù)研發(fā)體系時(shí)間不長(cháng),卻經(jīng)歷了三個(gè)階段:救火、驅動(dòng)和引領(lǐng)。2008年,京東商城上線(xiàn),技術(shù)團隊不到30人,業(yè)務(wù)發(fā)展太快,技術(shù)跟不上,哪里有火就往哪里撲去。到2010年,京東技術(shù)發(fā)展進(jìn)入到驅動(dòng)階段,技術(shù)圍繞公司戰略進(jìn)行了系統規劃,引入業(yè)務(wù)部門(mén)將產(chǎn)品做好,京東的開(kāi)放平臺、支撐配送體系的青龍系統、圖書(shū)品類(lèi)擴充等均在這個(gè)階段上線(xiàn)。目前,京東的技術(shù)已經(jīng)到了引領(lǐng)階段,技術(shù)團隊發(fā)展到5000人,形成的創(chuàng )新引領(lǐng)著(zhù)京東的發(fā)展。
京東副總裁馬松曾在一次公開(kāi)演講中把互聯(lián)網(wǎng)企業(yè)的技術(shù)發(fā)展比喻為汽車(chē)行駛:首先是起步階段,這個(gè)階段的汽車(chē)就好像一輛漏油的“破車(chē)”在高速路上飛馳,它的進(jìn)油的速度如果大于漏油的速度就可以保持前進(jìn),占據它在市場(chǎng)上自己應有的位置。第二個(gè)階段是可以在高速行駛過(guò)程中換輪胎、換部件,讓破車(chē)變成超級跑車(chē),但在換的過(guò)程中,車(chē)輛不能停止前進(jìn)。“這就是互聯(lián)網(wǎng)企業(yè)對技術(shù)團隊的需求。”
數據挖掘無(wú)止境
張晨總結:京東是一家以互聯(lián)網(wǎng)科學(xué)引領(lǐng)的網(wǎng)絡(luò )零售企業(yè),零售是它的基因,而零售最根本的是要給用戶(hù)做好服務(wù),京東可以通過(guò)技術(shù)手段把服務(wù)體驗提升更多。
物流已經(jīng)成為京東的核心競爭力,在今年618大促期間,有大量的商品實(shí)現了當日達,要讓物流更快可以通過(guò)大數據的方式來(lái)實(shí)現,例如對某個(gè)居住小區的消費偏好進(jìn)行分析,可以預先判斷哪些商品最暢銷(xiāo),把商品放在小區附近的配送站,當有消費者下單,便可實(shí)現配送,這樣能提升用戶(hù)體驗。
提升用戶(hù)體驗的第二方面,是在大數據的基礎上實(shí)現的精準推送。零售企業(yè)對商品是否暢銷(xiāo)的一個(gè)判斷是周轉率,而京東要實(shí)現提升周轉率便是對商品的精準推送,“千人千面”產(chǎn)品體現的是這樣的思路,京東商城研發(fā)部“推薦搜索部”劉尚堃表示:“在當前推薦位的情況下,再提升40%、50%的效能是能做到的,因為京東個(gè)性化首頁(yè)產(chǎn)品上線(xiàn)的時(shí)間并不長(cháng)。”
張晨認為,數據量越大,后發(fā)的價(jià)值越大,因為京東的商品大多數屬于自營(yíng),貨品有來(lái)源、質(zhì)量有保障、交易是真實(shí)的,這些讓京東成為“中國互聯(lián)網(wǎng)企業(yè)里數據最好的公司之一,用這些優(yōu)質(zhì)的數據反過(guò)來(lái)服務(wù)好用戶(hù),可挖的細節太多,是一件做不完的事情。”張晨這樣告訴記者。