日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

log4j按天生成且有按照文件大小分割_论文阅读TGM:轨迹生成

發布時間:2025/3/20 编程问答 19 豆豆
生活随笔 收集整理的這篇文章主要介紹了 log4j按天生成且有按照文件大小分割_论文阅读TGM:轨迹生成 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

這篇論文提出了一種能夠保證 -differential privacy 的軌跡生成機制TGM。TGM包括兩個階段,他們首先運用圖像生成算法來對數據進行編碼并能準確地捕捉到運動目標軌跡的統計數據,之后TGM通過加噪來秘密地生成合成軌跡。個人認為本文提出的對 privacy budget 的分配算法是非常值得學習的,并且TGM首次提出了將靜態或相對穩定的位置也考慮到生成軌跡中的想法。通過這篇論文的實驗結果可知,TGM在減少內存需求的同時,能夠實現較高的運算效率和數據可用性。

Mechanism Overview

TGM是一個包括兩個階段的軌跡隱私保護機制如算法1所示,步驟1用一個圖解模型來編碼使得每條軌跡是一串位置的經緯度坐標,TGM中的加噪過程在步驟二實現以滿足 -differential privacy。

階段一:真實軌跡建模

圖1舉例說明了TGM的過程,為了捕捉軌跡中的任一次運動行為,這篇論文提出了一個圖像生成概率模型來準確地對給定軌跡進行建模。一個運動中的目標在每個時間節點或許運動到新的位置,亦或許保持在原地不動。本文的模型適合滿足馬爾可夫過程的軌跡,即基于近期的軌跡上的訪問地點可以預測下一位置。在圖1.(a)中畫出了數據集D對應的真實軌跡,氣泡對話框內展示的是用戶在購物中心逗留的情況。圖1.(c)中Encoding模塊,每個節點表示的是圖1.(a)中的網格單元,相鄰兩節點間的方向箭頭表示目標從一個節點移動到另一個節點,藍色橢圓和紅色橢圓分別表示軌跡的起點和終點,這樣便把一個軌跡編碼為一個網絡結構圖。

階段二:生成合成軌跡

有了圖解模型G之后,第二步就是生成合成的軌跡。本文提出了一個原創算法在生成軌跡的過程中適應性地增加噪聲,隨機化這個過程使得這個算法能用任意長度來維持運動軌跡的模式。本文同時使用了指數機制(EM)和拉普拉斯機制(LM),給定生成軌跡的一些已知的位置信息,可以計算下一步的轉移概率:移動到下一個相鄰位置的概率、保持在同一位置的概率和是軌跡終點的概率,之后便可用EM來選擇一個點,用LM來加噪聲。這時需要分配總體的隱私預算,為EM的隱私預算,為LM的隱私預算。生成軌跡的過程將在到達終點或隱私預算被完全消耗的時候停止。圖2.(b)為生成數據集D’對應的軌跡圖像,圖1.(c)中步驟二Generation模塊的數據表展示了生成一個軌跡的過程。

Preliminaries

軌跡數據集

一條軌跡通常表示為 ,其中表示一個位置坐標,表示一個時間戳。在連續時間內,一段軌跡上的點都是重復的表示這個運動目標靜止在某一位置上,因此本文給出了軌跡片段的定義:

圖像生成模型

算法2用非平凡拓撲時空圖來對軌跡進行建模,模型表示一個定向圖,分別為節點和邊的集合。在空間上,每個節點有八個相鄰的網格單元,所以每個節點的出度為9(包括一個自我轉移)。在每個時間點,可以用k階馬爾可夫鏈來預測軌跡的狀態,k值隨著時間而增加。圖形結構使我們能夠建模任意長度軌跡的序列和分布并且區分出靜態和動態的軌跡片段,同時捕捉到軌跡間的交互鏈接模式。

Private Model Learning

在一個軌跡生成過程中,有以下三部分需要學習:起始位置的可用性、轉移概率和終止狀態,這些內容可以由圖像模型中的計數情況得到。算法3所示的軌跡生成過程能確保端到端的隱私保護從軌跡的起點到終點,并且能動態調整每一步中可導致不同軌跡長度的隱私預算。軌跡生成過程由確定初始點開始并持續選擇接下來的位置,函數First()和Next()用于計算可能的初始位置和下一位置的效用,此時EM用于隨機挑選一個潛在的位置來確保隱私的保護。函數DirChng()用于計算方向的變化,如果方向的變化小于偏差閾值,表示運動方向沒有很大程度上地改變,這時下一位置為函數EstLoc()的結果并且相應的EM的隱私預算將被歸還用于之后的步驟中,否則將會用EM來選擇位置。函數Rtn()用一個適應性的預算分配方法來分配。

隱私預算分配

如果生成軌跡的長度為n,總共的 將在 n 步中被分割,然而 n 值是未知的因為生成軌跡過程能夠在任一步終止。因此本文提出一個戰略來基于敏感度適應性地對每一步分配隱私預算,假設最多的隱私預算將會分配給第一個點并且在之后的步驟中序列性地降低分配到的預算,即。設定一個臨界值,當時,終止生成軌跡的過程。由于會對生成軌跡的長度產生一個上限,引入一個預算歸還方法來使得生成的軌跡能夠比這個上限更長。

隱私預算還原

本文引入稀疏向量的概念將隱私預算節省下來僅用于重大改變,給定在位置的方向為,在給定在位置的方向為,重大改變需滿足,本文設定偏差臨界值。更直觀地來看,如果新一步的偏差角度大于,即,認為運動目標的方向有了很大的改變,否則認為依然按照原方向運動。未有重大改變時撤回選定的位置并保持在的原方向來預測下一位置。

Evaluation

實驗數據

表一所列的是本文實驗所用的兩個數據集,Porto-Taxi提供了葡萄牙波爾圖市的的士軌跡,Melb-Car是由Minnesota Web-based Traffic Generator生成的位于墨爾本的合成數據集。

TGM表現評估

本文用TGM與DPT進行對比,DPT需要求用戶指定合成軌跡的長度,而TGM能夠動態地確認生成軌跡的長度。如圖4所示,本文采樣了Porto-Taxi中的十萬條軌跡記錄來對比TGM和DPT在運算速度、內存需求、Frechet距離和JS散度誤差且TGM的表現均優于DPT。圖5詳細表明了隨著網格尺寸變小(分辨率變大),TGM和DPT對內存需求的變化情況,TGM的內存需求隨網格分辨率呈線性增長,而DPT則為指數增長。圖7分析了使用適應性的預算分配方法和預算歸還戰略時TGM的效用的變化情況,np表示最優的結果以無隱私保護無噪聲為基準線,ndbr是為包括隱私預算歸還方法的TGM,fixed代表對每一步使用固定比例的來生成合成軌跡,結果中fixed和ndbr方法的較高的斜率表明這兩種方法對所加的噪聲更為敏感即缺乏魯棒性,實驗結果還表明了TGM對大都市的數據更為高效。

《新程序員》:云原生和全面數字化實踐50位技術專家共同創作,文字、視頻、音頻交互閱讀

總結

以上是生活随笔為你收集整理的log4j按天生成且有按照文件大小分割_论文阅读TGM:轨迹生成的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。