轨迹相似性度量之基于Hausdorff与LCSS的理解
1. 對(duì)于Hausdorff距離的理解
Hausdorff距離:描述兩組點(diǎn)集之間相似程度的一種度量。
假設(shè)兩組集合A={a1,a2,.....ap},B={b1,b2.....bp},則這兩個(gè)點(diǎn)集之間的Hausdorff距離定義為:
H(A,B)=max(h(A,B),h(A,B))? ? ?(1)
其中,h(A,B)=max(a∈A) min(b∈B) ||a-b||? ? ? ? ? ? ? ? (2),
? ? ? ? ? h(B,A)=max(b∈B) min(a∈A) ||b-a||? ? ? ? ? ? ? ? ?(3),
||·|| 是A和B點(diǎn)集間的距離范式。
(1)式稱為雙向Hausdorff距離,它度量了兩個(gè)點(diǎn)集間的最大不匹配程度。
(2)、(3)式中的h(A,B)? 、h(B,A)分別稱為從A集合到B集合? 和從集合B到集合A 的單向Hausdorff距離。
即h(A,B)實(shí)際上首先對(duì)點(diǎn)集A中的每個(gè)點(diǎn)ai到距離此點(diǎn)ai最近的B集合中點(diǎn)bj之間的距離‖ai-bj‖進(jìn)行排序,然后取該距離中的最大值作為h(A,B)的值。
?
圖例表示:
?
2.對(duì)于LCSS距離的理解
LCSS 最長(zhǎng)公共子序列?
歐氏距離和動(dòng)態(tài)時(shí)間規(guī)劃對(duì)軌跡的個(gè)別點(diǎn)差異性明顯。
如果兩個(gè)時(shí)間序列在大多數(shù)時(shí)間段具有相似的形態(tài),僅僅在很短時(shí)間內(nèi)具有一定的差異,則歐氏距離和DTW無法準(zhǔn)確衡量這兩個(gè)時(shí)間序列的相似度。
而LCSS能處理這種問題。
原理:
假設(shè)有兩個(gè)長(zhǎng)度分別為n和m的時(shí)間序列數(shù)據(jù)A和B ,那么最長(zhǎng)公共子序列的長(zhǎng)度為:
其中,γ為成員相似閾值,t=1,2,...n;i=1,2,...m。基于上述公式,最長(zhǎng)公共子序列的相似度公式為:
LCSS算法可以計(jì)算兩個(gè)子序列之間的最長(zhǎng)公共子序列。
結(jié)合具體實(shí)例理解:
3.改進(jìn)LCSS算法
見https://blog.csdn.net/weixin_30745641/article/details/95504238
改進(jìn)后LCSS算法
優(yōu)點(diǎn):結(jié)合時(shí)間、地理因素,提高相似度計(jì)算的準(zhǔn)確性
缺點(diǎn):需要抽取時(shí)間序列,構(gòu)造用戶軌跡的頻繁序列,然后才能用改進(jìn)的LCSS相似度算法計(jì)算用戶軌跡的相似度,
? ? ? ? ? 因此算法模型過程比較復(fù)雜。
參考:
https://www.cnblogs.com/yhlx125/p/5478147.html
https://www.jianshu.com/p/d7b8db280a01?utm_campaign=maleskine&utm_content=note&utm_medium=reader_share&utm_source=weixin
https://www.it610.com/article/1293141069264920576.htm
https://blog.csdn.net/weixin_30745641/article/details/95504238
?
?
總結(jié)
以上是生活随笔為你收集整理的轨迹相似性度量之基于Hausdorff与LCSS的理解的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 5.8 直方图统计
- 下一篇: 机器学习也可以在线做!