日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

2018.01.21.一周机器学习周记

發(fā)布時間:2025/3/20 编程问答 22 豆豆
生活随笔 收集整理的這篇文章主要介紹了 2018.01.21.一周机器学习周记 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

時間:2018.01.21.一周


主要內容


1.整理前期關于決策樹的一個小型實踐項目文檔(實踐進行中)

2.搭建TensorFlow環(huán)境(進行中)

3.拓展:實踐Python的自動化模塊pyautogui模塊

4.后期承得前會長吳師兄的參考文檔,開始對騰訊算法大賽進行項目研究



內容摘要及相關概況


決策樹實踐項目

詳見項目文檔


搭建TensorFlow環(huán)境

1.通過pip安裝TensorFlow基本包

2.在cmd處import tensorflow

3.根據(jù)提示,在官網(wǎng)下載對應的CUDA版本,下載完成后進行安裝(安裝之前先卸載本地的舊版本)

4.下載cuDNN對應的壓縮包


pyautogui模塊

本周實踐了一系列pyautogui模塊的函數(shù),這里主要摘要一個實踐:


功能

實時給出鼠標當前位置的x、y坐標,也給出這個像素的RGB顏色


代碼



騰訊算法大賽

參考于前會長吳師兄的文檔

本周進度

由賽題屬于廣告學范疇,一開始通過對?轉化率預估此篇文章的閱讀,對相關概念有所理解

隨后,閱讀理解了?騰訊算法大賽以及 FAQ 部分


賽題要求

官方提供17-30天移動 APP 的廣告、用戶的轉化情況,及相關上下文, 根據(jù)這些數(shù)據(jù)預測第31天指定用戶和對應廣告的轉化率.


評估方式 (賽題中提供的計算公式)

通過Logarithmic Loss評估(越小越好),公式如下:

其中,

N是測試樣本總數(shù),

yi是二值變量,取值0或1,表示第i個樣本的label,

pi為模型預測第i個樣本 label為1的概率。


示例代碼(Python語言實現(xiàn)):



項目目的

主要在于剖析和學習大賽中取得 第64 名大牛的分享, 對其代碼進行理解和分析, 主要著重點在于特征工程。


機器學習的主要流程


機器學習流程


數(shù)據(jù)分析和清洗方法



關于數(shù)據(jù)分析,閱讀FAQ可知:

App 的激活定義為用戶下載后啟動了該App,即發(fā)生激活行為。從用戶點擊廣告到廣告系統(tǒng)得知用戶激活了App(如果有),通常會有較長的時間間隔,主要由以下兩方面原因導致:

1) 用戶可能在下載之后過了很久才啟動App;

2) 用戶啟動App的行為需要廣告主上報回傳給廣告系統(tǒng),通常會有一定的延時。

這里回流時間表示了廣告主把App激活數(shù)據(jù)上報給廣告系統(tǒng)的時間,回流時間超過5天的數(shù)據(jù)會被系統(tǒng)忽略。

值得注意的是,本次競賽的訓練數(shù)據(jù)提供的截止第31天0點的廣告日志,因此,對于最后幾天的訓練數(shù)據(jù),某些label=0并不夠準確,可能廣告系統(tǒng)會在第31天之后得知label實際上為1。

某些app和用戶的記錄比較少

最后幾天有部分數(shù)據(jù)不準確

對于這個問題, 這里采用了比較暴力的方法, 將最后幾天這些可能會出現(xiàn)問題的數(shù)據(jù)刪除

總結

以上是生活随笔為你收集整理的2018.01.21.一周机器学习周记的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內容還不錯,歡迎將生活随笔推薦給好友。