日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

【数据竞赛】消费金融场景下的用户购买预测冠军方案分享

發布時間:2025/3/12 编程问答 24 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【数据竞赛】消费金融场景下的用户购买预测冠军方案分享 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

大賽介紹

2000多年前,阿基米德說:“給我一個支點,我可以撬動整個地球”。伴隨近年來新技術的快速涌現和迅猛發展,大數據或將成為傳統金融行業向金融科技轉型的“阿基米德支點”。

作為業內領先品牌,招商銀行信用卡中心在全力打造Fintech銀行的過程中,始終走在變化的前沿。我們在全景智額、千人千面、大數據風控等金融科技方面的嘗試與創新,也正是因為打造了從數據收集到數據清洗、再到數據挖掘和商業應用的一體化大數據平臺。

我們希望,在數據已經成為戰略資源和經濟資產的今天,通過此次數據大賽,捕捉在消費金融場景下的用戶價值信息與消費需求,發揮數據價值,給用戶提供更加精準的服務。也可以讓廣大高校學生對消費金融、對信用卡數據應用,能有更深刻的接觸與了解。

賽題背景

掌上生活APP是招商銀行于2010年推出的手機客戶端應用軟件,全面升級了信用卡的使用體驗。當前6.0版本的掌上生活APP,提供了手機商城、飯票影票、在線客服、基金理財、辦卡開卡、額度管理、消費信貸、賬單管理等全方位功能,同時實現了LBS查詢服務和手機遠程支付,全面滿足并提升了持卡人對金融和日常生活需求的消費體驗。

招商銀行信用卡在不斷拓展業務與場景的同時,也希望通過數據積累與數據驅動,主動捕捉用戶價值信息與消費需求,發揮數據價值,給用戶提供更加精準的服務。

賽題任務

利用招商銀行客戶的個人屬性、信用卡消費數據,以及部分客戶在掌上生活APP上的一個月的操作行為日志,設計合理的特征工程與模型算法方案,預測客戶在未來一周內(4月1日-7日),是否會購買掌上生活APP上的優惠券(包括飯票、影票等)??紤]到客戶隱私,客戶的個人屬性數據與信用卡消費數據,采用脫敏并標準化處理為V1,V2,…,V30數值型屬性??蛻粼贏PP上的行為日志,一些字段也進行了相應加密。

賽題數據

本次比賽提供的數據集包括訓練數據與測試數據,訓練數據共分為三部分:

(1)個人屬性與信用卡消費數據:包含80000名信用卡客戶的個人屬性與信用卡消費數據,其中包含枚舉型特征和數值型特征,均已轉為數值并進行了脫敏和標準化處理。

(2)APP操作行為日志:上述信用卡客戶中,部分已綁定掌上生活APP的客戶,在近一個月時間窗口內的所有點擊行為日志。

(3)標注數據:包括客戶號及標簽。其中,標簽數據為用戶是否會在未來一周,購買掌上生活APP上的優惠券。

文件清單和使用說明

  • train/ ——訓練樣本目錄,包含三個文件

  • train_agg.csv —— 個人屬性與信用卡消費數據

  • train_log.csv ——APP操作行為日志

  • train_flag.csv ——標注數據

  • test/ ——評測樣本目錄,包含兩個文件,不提供標注數

  • test_agg.csv —— 個人屬性與信用卡消費數據

  • test_log.csv—— APP操作行為日志

冠軍方案

賽題分析

特征工程(常規特征)

主要按照特征群進行提取:基礎統計特征,離散特征,時序相關特征。

特征工程(亮點一:時序特征)

特征工程(亮點二:NLP特征)

特征工程

特征選擇:
  • 基于XGB的特征重要性

    • 先訓練一個XGBoost模型,輸出其特征重要性,然后將重要性為0的特征刪除,即完成了特征選擇。

  • 基于wrapper的方式

  • 基于貪心算法,尋找最優特征子集,如上圖所示。

目的:
  • 降維,使模型泛化能力更強,減少過擬合。

模型設計

模型融合(基于Rank)

比賽評價標準為AUC,其本質為排序優化問題概率得分線性加權是存在問題的,所以需要進行調整。

應用場景

潛力:
  • 特征具有可解釋性

  • 模型的驗證方法具有穩定性

  • 隨著數據量的增大,Word2vec特征會有更好的效果。

  • 自然語言處理領域中成熟的方法可應用到用戶行為識別中。

價值:
  • 商家廣告精準投放。

  • 個性化推薦優惠信息。

參賽總結

不足:
  • 對于agg表只進行了簡單的二元化和rank處理,沒有深度發掘。

  • 模型的融合的權重是根據線上成績,其實可以采用線性回歸的方式得到。

收獲:
  • NLP和普通機器學習的結合

  • 堅持的重要性

  • 團隊協作能力都得到了較大的提升

冠軍代碼:https://github.com/sunwantong/China-Merchants-Bank-credit-card-Cente-User-purchase-forecast


往期精彩回顧適合初學者入門人工智能的路線及資料下載機器學習及深度學習筆記等資料打印機器學習在線手冊深度學習筆記專輯《統計學習方法》的代碼復現專輯 AI基礎下載機器學習的數學基礎專輯 獲取本站知識星球優惠券,復制鏈接直接打開: https://t.zsxq.com/qFiUFMV 本站qq群704220115。加入微信群請掃碼:

總結

以上是生活随笔為你收集整理的【数据竞赛】消费金融场景下的用户购买预测冠军方案分享的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。