前兩天參加同學(xué)聚會(huì),大家問我最近在做什么工作。我一說我在做廣告算法的工作,大家立馬贊嘆了起來:“廣告算法?這聽起來就很高大上呀?!薄八惴üこ處??聽說搞算法的掙的都很多,真是羨慕。”有些同學(xué)對我的工作比較好奇,問我:“你們平常都做些什么工作?和廣告模型相關(guān)嗎?”
看來大家對廣告算法工程師還真的是存在一些誤解。外行人覺得,廣告算法工程師每天都在和各種各樣的模型、算法打交道,實(shí)際上則不然。在廣告算法這個(gè)行業(yè)里,數(shù)據(jù)往往才是最重要的,其次是特征,最后才能輪得到算法。
在實(shí)際的工作中,如果廣告算法工程師只精通做模型,是很難取得好的工作效果的。
廣告算法工程師的真實(shí)日常是怎樣的?
比如一個(gè)擅長做模型的工程師,不停地做模型優(yōu)化,不停地做調(diào)參,把所有的參數(shù)能試的都試一遍,什么學(xué)習(xí)率、優(yōu)化器、batch_size等等。最后卻發(fā)現(xiàn),auc曲線沒有上升反而下降了。再比如一個(gè)擅長做特征的工程師,不會(huì)在模型上下很多功夫,會(huì)對特征做更多的處理,比如為了增加模型的泛化性而添加一些統(tǒng)計(jì)類特征。最后發(fā)現(xiàn),auc曲線出現(xiàn)了一些上升的趨勢,ctr(點(diǎn)擊通過率)也表現(xiàn)出上升的趨勢。這就算是取得一個(gè)不錯(cuò)的工作成果。
那擅長數(shù)據(jù)的廣告算法工程師會(huì)怎么做呢?他會(huì)選擇在數(shù)據(jù)方面做一些改進(jìn),比如刪除一些沒有回傳轉(zhuǎn)化價(jià)值的廣告主數(shù)據(jù),或者優(yōu)化廣告主回傳轉(zhuǎn)化數(shù)據(jù)的方式方法等等。這樣的方法往往會(huì)取得很好的工作成果,不論是auc曲線還是ctr,都可以看到大幅的上升。
所以,廣告算法工程師更多的是處理數(shù)據(jù)與特征,最后才會(huì)考慮算法和模型。這才是最真實(shí)的廣告算法工程師的工作日常。這也是為什么,有些人戲謔稱我們?yōu)椤皵?shù)據(jù)庫工程師”,說我們每天都是在跟數(shù)據(jù)打交道。
廣告算法工程師的真實(shí)日常是怎樣的?
除了跟數(shù)據(jù)打交道,我們還需要根據(jù)銷售部門反饋回來的各種案例,對轉(zhuǎn)化率模型進(jìn)行修改和優(yōu)化。銷售部門經(jīng)常反饋回來一堆問題:為什么這個(gè)賬戶實(shí)際跑量遠(yuǎn)遠(yuǎn)低于前期預(yù)估值,為什么這個(gè)賬戶超出成本預(yù)算那么多,等等。定位案例原因,也是我們經(jīng)常做的事情。
這就是廣告算法工程師的真實(shí)日常,并沒有大家想象之中的那么高大上,那么遙不可及。