日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

embedding 层的详细解释

發(fā)布時(shí)間:2025/4/5 编程问答 26 豆豆
生活随笔 收集整理的這篇文章主要介紹了 embedding 层的详细解释 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

原文鏈接

在這篇文章中,我們將介紹keras的嵌入層。為此,我創(chuàng)建了一個(gè)僅包含3個(gè)文檔的樣本語(yǔ)料庫(kù),這足以解釋keras嵌入層的工作。

詞嵌入在各種機(jī)器學(xué)習(xí)應(yīng)用程序中很有用在開(kāi)始之前,讓我們?yōu)g覽一下詞嵌入的一些應(yīng)用:

  • 第一個(gè)吸引我的應(yīng)用程序是在基于協(xié)同過(guò)濾的推薦系統(tǒng)中,我們必須通過(guò)分解包含用戶(hù)項(xiàng)等級(jí)的效用矩陣來(lái)創(chuàng)建用戶(hù)嵌入和電影嵌入。
    要查看有關(guān)在Keras中使用詞嵌入的基于CF推薦系統(tǒng)的完整教程,可以遵循我的這篇文章。

  • 第二種用途是在自然語(yǔ)言處理及其相關(guān)應(yīng)用程序中,我們必須為語(yǔ)料庫(kù)文檔中存在的所有單詞創(chuàng)建單詞嵌入。這是我將在此內(nèi)核中使用的術(shù)語(yǔ)。

  • 因此,當(dāng)我們想要?jiǎng)?chuàng)建將高維數(shù)據(jù)嵌入到低維向量空間中的嵌入時(shí),可以使用Keras中的嵌入層。

#!/usr/bin/env python3 # -*- coding: utf-8 -*- """ Created on Sat Oct 10 16:33:58 2020 @author: lediimport warnings warnings.filterwarnings('always') warnings.filterwarnings('ignore')# data visualisation and manipulation import numpy as np import pandas as pd import matplotlib.pyplot as plt from matplotlib import style import seaborn as sns #configure # sets matplotlib to inline and displays graphs below the corressponding cell. # %matplotlib inline style.use('fivethirtyeight') sns.set(style='whitegrid',color_codes=True)#nltk import nltk#stop-words from nltk.corpus import stopwords stop_words=set(nltk.corpus.stopwords.words('english'))# tokenizing from nltk import word_tokenize,sent_tokenize#keras import keras from keras.preprocessing.text import one_hot,Tokenizer from keras.preprocessing.sequence import pad_sequences from keras.models import Sequential from keras.layers import Dense , Flatten ,Embedding,Input from keras.models import Model# 這可以理解為三篇文章 sample_text_1="bitty bought a bit of butter" sample_text_2="but the bit of butter was a bit bitter" sample_text_3="so she bought some better butter to make the bitter butter better"corp=[sample_text_1,sample_text_2,sample_text_3] no_docs=len(corp)

此后,所有唯一詞都將由一個(gè)整數(shù)表示。 為此,我們使用Keras中的one_hot函數(shù)。 請(qǐng)注意,vocab_size被指定為足夠大,以確保每個(gè)單詞的唯一整數(shù)編碼。

注意一件重要的事情,即單詞的整數(shù)編碼在不同文檔中保持不變。 例如,“butter”在每個(gè)文檔中都用31表示。

指定詞向量的長(zhǎng)度
vocab_size=50 encod_corp=[] for i,doc in enumerate(corp):encod_corp.append(one_hot(doc,50))# print(one_hot(doc,50))print("The encoding for document",i+1," is : ",one_hot(doc,50)) # length of maximum document. will be nedded whenever create embeddings for the words maxlen=-1 for doc in corp:tokens=nltk.word_tokenize(doc)if(maxlen<len(tokens)):maxlen=len(tokens) print("The maximum number of words in any document is : ",maxlen)

Keras嵌入層要求所有單個(gè)文檔的長(zhǎng)度都相同。 因此,我們現(xiàn)在將較短的文檔填充0。 因此,現(xiàn)在在Keras嵌入層中,“ input_length”將等于具有最大長(zhǎng)度或最大單詞數(shù)的文檔的長(zhǎng)度(即單詞數(shù))。

為了填充較短的文檔,我使用Keras庫(kù)中的pad_sequences函數(shù)。
# now to create embeddings all of our docs need to be of same length. hence we can pad the docs with zeros. pad_corp=pad_sequences(encod_corp,maxlen=maxlen,padding='post',value=0.0) print("No of padded documents: ",len(pad_corp))

現(xiàn)在所有文檔的長(zhǎng)度相同(填充后)。 因此,現(xiàn)在我們可以創(chuàng)建和使用嵌入了。我將這些詞嵌入8維向量中。

# specifying the input shape # input=Input(shape=(no_docs,maxlen),dtype='float64')""" 嵌入層的參數(shù)--- 'input_dim'=我們將選擇的單詞集合大小。 換句話說(shuō),這是詞匯中唯一詞的數(shù)量。 “ output_dim” =我們希望嵌入的尺寸數(shù)。 每個(gè)單詞都將由一個(gè)如此大小的向量表示。 'input_length'=最大文檔的長(zhǎng)度。 在我們的例子中,它存儲(chǔ)在maxlen變量中。 """''' shape of input. each document has 12 element or words which is the value of our maxlen variable.''' word_input=Input(shape=(maxlen,),dtype='float64') # creating the embedding word_embedding=Embedding(input_dim=vocab_size,output_dim=8,input_length=maxlen)(word_input)word_vec=Flatten()(word_embedding) # flatten embed_model =Model([word_input],word_embedding) # combining all into a Keras model embed_model.summary()embed_model.compile(optimizer=keras.optimizers.Adam(lr=1e-3),loss='binary_crossentropy',metrics=['acc']) # compiling the model. parameters can be tuned as always.print(type(word_embedding)) print(word_embedding)embeddings=embed_model.predict(pad_corp) # finally getting the embeddings.""" 結(jié)果形狀為(3,12,8)。 3 --->文件的數(shù)量 12->每個(gè)文件由12個(gè)字組成,這是我們所有文件的最大長(zhǎng)度。 &8 --->每個(gè)單詞都是8維的。 """ print("Shape of embeddings : ",embeddings.shape) print(embeddings)embeddings=embeddings.reshape(-1,maxlen,8) print("Shape of embeddings : ",embeddings.shape) print(embeddings)
現(xiàn)在,這使我們可以更容易地看到我們有3個(gè)文檔,每個(gè)文檔包含12個(gè)(最大長(zhǎng)度)單詞,每個(gè)單詞映射到8維向量。

如何處理一段真實(shí)的文本
就像上面一樣,我們現(xiàn)在可以使用任何其他文檔。 我們可以將文件send_tokenize變成句子。

每個(gè)句子都有一個(gè)單詞列表,我們將使用“ one_hot”函數(shù)對(duì)這些單詞進(jìn)行整數(shù)編碼,如下所示。

現(xiàn)在,每個(gè)句子將具有不同數(shù)量的單詞。 因此,我們需要將序列填充到最大單詞數(shù)的句子中。

此時(shí),我們已經(jīng)準(zhǔn)備好將輸入提供給Keras嵌入層,如上所示。

‘input_dim’=我們將選擇的詞匯表大小

‘output_dim’=我們希望嵌入的尺寸數(shù)

‘input_length’=最大文檔長(zhǎng)度

《新程序員》:云原生和全面數(shù)字化實(shí)踐50位技術(shù)專(zhuān)家共同創(chuàng)作,文字、視頻、音頻交互閱讀

總結(jié)

以上是生活随笔為你收集整理的embedding 层的详细解释的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 亚洲人无码成www久久 | 久久久极品 | 狠狠一区 | 乱精品一区字幕二区 | 天堂中文在线资 | 成人免费毛片aaaaaa片 | 999国产 | 国产在线第一页 | av成人 | 成人午夜淫片免费观看 | 黄色资源网 | 精品国产一区在线 | 日韩新片王网 | 少妇一级淫片 | 国产91一区二区三区在线精品 | 亲子乱子伦xxxx | 3d动漫精品啪啪一区二区免费 | 欧美日本成人 | 午夜不卡在线观看 | 亚洲日本成人 | 国产又大又粗又爽的毛片 | 黄色一级图片 | 久久国产欧美日韩精品 | 在线天堂v | 亚洲欧美日韩国产一区二区三区 | 青草久久网 | 黄色一级免费看 | 在线观看欧美一区二区三区 | 999av视频| 少妇精品无码一区二区免费视频 | 亚洲码无人客一区二区三区 | 黑人巨大av | 九九九在线观看 | 日本久久99 | 国产精品区一区二 | 久久岛国| 中文字幕中文在线 | 中文乱码人妻一区二区三区视频 | 日本高清视频免费看 | 亚洲а∨天堂久久精品2021 | 成人在线免费网址 | 国产图片区 | 极品色影视 | 91精品免费看 | 国产精品久久久久久久久夜色 | 亚洲精品久久一区二区三区777 | 欧美做爰啪啪xxxⅹ性 | 亚洲乱熟女一区二区三区小说 | 伊人春色av | 成人免费看av | 国产一区二区精品久久 | 韩国美女福利视频 | 日本不卡视频一区 | 日日天天干 | 黄色片在线观看免费 | 日韩成人av影院 | 四虎国产精品永久免费观看视频 | 欧洲av一区二区 | 午夜精品电影 | 在线国产三级 | 网址你懂的在线 | 国产网站免费看 | 日韩欧美亚洲成人 | 国产碰碰 | 久草资源 | 人人妻人人澡人人爽人人欧美一区 | 中文字幕一区二区在线播放 | 91久久久久久久久久久 | 农民工hdxxxx性中国 | 国产手机精品视频 | 久久性视频| 欧美性生活精品 | 91高清视频免费观看 | 日本一区二区三区视频在线 | 无遮挡又爽又刺激的视频 | 色视频在线播放 | 伊人久久婷婷 | 欧美日日夜夜 | 真人毛片97级无遮挡精品 | 中文字幕一区二区免费 | 男男成人高潮片免费网站 | 91涩涩涩| 99热视 | 色偷偷亚洲 | 亚洲一区二区三区人妻 | 免费在线黄色网址 | 日韩理论片在线观看 | 尤物网站在线观看 | 老司机免费在线视频 | 亚洲精品字幕在线观看 | 爱爱一区二区三区 | 成人免费黄色片 | 18禁男女爽爽爽午夜网站免费 | 涩涩五月天 | 91视频区 | 91精品国产综合久久国产大片 | 91九色蝌蚪 | 午夜视频网站 | 欧美精品久久 |