日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

f1 score 代码_腾讯广告算法大赛冠军代码解读:稠密特征工程

發布時間:2023/12/15 编程问答 33 豆豆
生活随笔 收集整理的這篇文章主要介紹了 f1 score 代码_腾讯广告算法大赛冠军代码解读:稠密特征工程 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

什么是稠密特征?

本賽題中利用 word2vec 變換得到的特征維度設定為 n*64,因此得到的稠密特征也是一個 n*64 的矩陣。稠密的特性體現在,64 個維度上每一個維度都存在有意義的值,需要進行計算。如下圖:

稠密特征的特點是保留了盡可能多的信息,但是相應的也增加了很多的計算量,大大提高了計算的時間復雜度。

如何得到稠密特征?

本賽題中使用 word2vec 和 deepwalk 兩種模型來獲得稠密特征。

word2vec 旨在利用一個簡單的神經網絡模型,對特征按照神經元個數進行矩陣分解,得到的中間矩陣就是我們想要的稠密特征。

deepwalk 是一個圖模型,旨在表達節點之間的點和邊的關系。可以得到如下圖的矩陣:

代碼

word2vec

model = Word2Vec(sentence, size=L, window=10, min_count=1, workers=10,iter=10)

deepwalk

# 構建圖dic={}for item in log[[f1,f2]].values:try:str(int(item[1]))str(int(item[0]))except:continuetry:dic['item_'+str(int(item[1]))].add('user_'+str(int(item[0])))except:dic['item_'+str(int(item[1]))]=set(['user_'+str(int(item[0]))])try:dic['user_'+str(int(item[0]))].add('item_'+str(int(item[1])))except:dic['user_'+str(int(item[0]))]=set(['item_'+str(int(item[1]))]) # 構建路徑 path_length=10 sentences=[]length=[]for key in dic:sentence=[key]while len(sentence)!=path_length:key=dic[sentence[-1]][random.randint(0,dic_cont[sentence[-1]]-1)]if len(sentence)>=2 and key == sentence[-2]:breakelse:sentence.append(key)sentences.append(sentence)length.append(len(sentence))if len(sentences)%100000==0:print(len(sentences)) # 使用 word2vec 訓練Deepwalk模型random.shuffle(sentences)model = Word2Vec(sentences, size=L, window=4,min_count=1,sg=1, workers=10,iter=20) # 對模型進行輸出 out_df=pd.DataFrame(w2v)

賽題里是如何使用稠密特征的?

本賽題是直接將稠密特征放入 MLP 中計算的

if hparams.dense_features is not None:feed_dic[self.dense_features]=train_dense_features[idx*hparams.batch_size:min((idx+1)*hparams.batch_size,len(train))] ... loss,_,norm=sess.run([self.score,self.update,self.grad_norm],feed_dict=feed_dic)

本賽題中涉及到到稠密特征?

  • uid_w2v_embedding_aid_64_1
  • uid_w2v_embedding_aid_64_2
  • ...
  • uid_w2v_embedding_aid_64_64
  • uid_aid_aid_deepwalk_embedding_64_1
  • uid_aid_aid_deepwalk_embedding_64_2
  • ...
  • uid_aid_aid_deepwalk_embedding_64_64
  • periods_on_1
  • periods_on_2
  • ...
  • periods_on_48

總結

以上是生活随笔為你收集整理的f1 score 代码_腾讯广告算法大赛冠军代码解读:稠密特征工程的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。