图数据的攻与防:智谱AI和biendata联合组织KDD Cup 2020
由智譜 AI 和數據競賽平臺 biendata 聯合組織的 KDD Cup 2020 目前已經全面展開。本次比賽采用了創新的賽題和賽制,主題為圖數據的攻防。本次比賽獎金 2 萬美元。?
KDD Cup 由 ACM SIGKDD 主辦,是全世界影響力最大的數據競賽,有“數據世界杯”之稱。今年的 KDD Cup 是智譜 AI 第一次參與 KDD Cup,也是 biendata 承辦的第四道 KDD Cup 賽題。目前,biendata 已是全球承辦 KDD Cup 賽題最多的平臺之一。
參賽方法
查看比賽詳情,請點擊閱讀原文或掃描下圖二維碼。
比賽背景
在自然界和社會科學中,圖結構無處不在,包括分子結構、社交網絡、論文引用網絡和細胞信號通路等。其中,最早于 1965 年被提出的論文引用網絡 [1] 是一種典型的圖結構:論文是節點,引用關系是邊。研究論文引用網絡可以在很多領域得到引用,比如科學影響評估,知識發現,以及技術預見等。?
深度學習已經在很多領域獲得了成功。最近,研究者發現很多深度學習技術可以用于圖數據?[2]?。不過,深度學習模型非常容易受到攻擊。一個非常類似原數據的對抗樣本,可以極大地拉低分類器的性能 [3]。這種情況在圖數據上也會出現。2018 年的 KDD 最佳論文就發現極其輕微的擾動就能讓節點分類器的準確率大幅下降 [4]。在論文引用網絡中,可能存在多種類型的對抗攻擊。例如,預打印論文網站(如 arxiv)中的論文因為無需同行評議,所以存在很多低質量的引用?[5]。另一種是虛假引用(coercive citation)。2019 年,《自然》雜志報道了著名出版商愛思唯爾調查發現數百名研究人員通過操縱同行評議流程,增加自己的論文引用數 [6]。
這些對引文網絡的攻擊不僅會降低公眾對科技行業的信任,也會損害對學術數據進行定量分析的努力。所以,我們組織這次比賽,希望可以研究如何攻擊和防御學術圖數據。
比賽任務
本次比賽分為兩個階段。
階段I:攻擊組織者的模型
在本次比賽中,參賽隊伍需要對組織者提供的圖數據進行攻擊,并拉低組織者的節點分類器的準確率。已有的圖包括 593,486 個節點,每個節點都有一個 100 維的特征。其中 543,486 個節點是訓練數據,50,000 個節點是測試數據。組織者在后臺提供一個節點分類器,為 50,000 個測試節點進行分類。分類器不會被發布。
參賽選手可以添加不超過 500 個新的節點,達到干擾圖數據的結果。每個新的節點最多只能有 100 條邊。包含了新節點的圖將會干擾分類器,降低分類器的性能。如果降低的幅度越大,干擾的效果就越好。
圖說:參賽選手需要提交一個很小的矩陣,對原圖鄰接矩陣略微修改,并試圖拉低分類器的性能。
訓階段II:隊伍之間的攻防?
在第二階段,參賽隊伍需要根據一個新的圖數據集,同時提交攻擊和防御器。組織者將在比賽后匹配所有參賽隊伍的攻擊和防御,計算分數。
比賽討論群
已添加過“數據競賽小助手”的選手,請直接私信:機構+姓名+KDD。由數據競賽小助手邀請加入比賽討論群。
如果沒有添加,請添加 biendata 小助手,可以通過以下二維碼添加小助手好友,添加請備注“機構+姓名+KDD”,備注格式不正確將不予通過。
公益合作
AI Time、學術頭條
????
現在,在「知乎」也能找到我們了
進入知乎首頁搜索「PaperWeekly」
點擊「關注」訂閱我們的專欄吧
關于PaperWeekly
PaperWeekly 是一個推薦、解讀、討論、報道人工智能前沿論文成果的學術平臺。如果你研究或從事 AI 領域,歡迎在公眾號后臺點擊「交流群」,小助手將把你帶入 PaperWeekly 的交流群里。
總結
以上是生活随笔為你收集整理的图数据的攻与防:智谱AI和biendata联合组织KDD Cup 2020的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 恐怖冒险游戏改编电影《直到黎明》杀青,预
- 下一篇: 微软建议:购买新电脑以升级至 Win11