日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

python计算余弦距离_在Python中计算余弦距离的优化方法

發布時間:2023/12/15 python 31 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python计算余弦距离_在Python中计算余弦距离的优化方法 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

如果可以使用SciPy,可以使用spatial.distance中的余弦值:

如果您不能使用SciPy,您可以嘗試通過重寫Python來獲得一個小的加速(編輯:但是沒有像我以前想像的那樣工作,見下文).

from itertools import izip

from math import sqrt

def cosine_distance(a, b):

if len(a) != len(b):

raise ValueError, "a and b must be same length"

numerator = sum(tup[0] * tup[1] for tup in izip(a,b))

denoma = sum(avalue ** 2 for avalue in a)

denomb = sum(bvalue ** 2 for bvalue in b)

result = 1 - numerator / (sqrt(denoma)*sqrt(denomb))

return result

當a和b的長度不匹配時,最好引發異常.

通過在sum()調用中使用生成器表達式,您可以通過Python中的C代碼完成大部分工作來計算您的值.這應該比使用for循環更快.

我沒有計時,所以我不能猜到它可能會更快.但是SciPy代碼幾乎肯定是用C或C編寫的,它應該是你能得到的一樣快.

如果你在Python中做生物信息學,那么你真的應該使用SciPy.

編輯:Darius Bacon定時我的代碼,發現它慢.所以我定時我的代碼,是的,這是比較慢的.所有的教訓:當你想加快速度時,不要猜測,測量.

為什么我試圖在Python的C內部部署更多的工作,我感到很困惑.我嘗試了長度為1000的列表,它仍然較慢.

我無法再花更多的時間嘗試巧妙地闖入Python.如果你需要更多的速度,我建議你嘗試SciPy.

編輯:我只是手工測試,沒有時間.我發現,對于a和b,舊的代碼更快;對于長a和b,新代碼更快;在這兩種情況下,差異不大. (我現在想知道我是否可以信任我的Windows計算機上的時間;我想在Linux上再次嘗試這個測試.)我不會改變工作代碼來試圖讓它更快.還有一次我敦促你嘗試SciPy. 🙂

總結

以上是生活随笔為你收集整理的python计算余弦距离_在Python中计算余弦距离的优化方法的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。