毕设资料整理
bert相關
Bert核心代碼解讀https://blog.csdn.net/one_super_dreamer/article/details/105344649
https://blog.csdn.net/one_super_dreamer/article/details/105181690深度學習在NLP領域的發(fā)展之Transformer
https://blog.csdn.net/one_super_dreamer/article/details/105206692Bert模型詳解和訓練實例
https://www.jianshu.com/p/160c4800b9b5BERT模型學習與分析
https://nbviewer.jupyter.org/github/aespresso/a_journey_into_math_of_ml/blob/master/04_transformer_tutorial_2nd_part/.ipynb_checkpoints/transformer_2-checkpoint.ipynb中文自然語言處理
Transformer模型(二)
BERT的預訓練與應用
https://nbviewer.jupyter.org/github/aespresso/a_journey_into_math_of_ml/blob/master/03_transformer_tutorial_1st_part/transformer_1.ipynb中文自然語言處理
Transformer模型(一)
https://github.com/aespresso/a_journey_into_math_of_ml/blob/master/03_transformer_tutorial_1st_part/transformer_1.ipynb
image captioning
【CV+NLP】更有智慧的眼睛:圖像描述(Image Caption)&視覺問答(VQA)綜述(上)https://zhuanlan.zhihu.com/p/52499758
caption重要性 image_Multimodal —— 看圖說話(Image Caption)任務的論文筆記(一)評價指標和NIC模型…h(huán)ttps://blog.csdn.net/weixin_28689193/article/details/112013520?utm_medium=distribute.pc_relevant.none-task-blog-baidujs_title-1&spm=1001.2101.3001.4242
https://blog.csdn.net/weixin_44826203/article/details/107609852?utm_medium=distribute.pc_relevant_download.none-task-blog-baidujs-1.nonecase&depth_1-utm_source=distribute.pc_relevant_download.none-task-blog-baidujs-1.nonecase超詳細!“看圖說話”(Image Caption)項目實戰(zhàn)
https://blog.csdn.net/weixin_45385271/article/details/105416176?utm_medium=distribute.pc_relevant.none-task-blog-baidujs_title-0&spm=1001.2101.3001.4242用于圖像字幕生成(image caption)數據集
Image Caption:圖像字幕生成https://blog.csdn.net/yujianmin1990/article/details/81259340
圖像字幕生成概述https://zhuanlan.zhihu.com/p/158511833
https://segmentfault.com/a/1190000017341866
深度學習實現自動生成圖片字幕
文檔識別 · 計算機視覺 · 多模態(tài)學習 · 圖像字幕 · 自然語言處理 · 2019 年 9 月 20 日
[ICDAR2019"網絡"在語言、視覺和語言方面:計算機視覺中的文本模式
https://www.zhuanzhi.ai/topic/2001366226698728
基于Conditional Layer Normalization的條件文本生成
https://kexue.fm/archives/7124#%E6%80%9D%E8%B7%AF%E7%BB%86%E8%8A%82
【圖像理解】自動生成圖像的文本描述https://blog.csdn.net/jinxueliu31/article/details/51008271?utm_medium=distribute.pc_relevant.none-task-blog-baidujs_baidulandingword-5&spm=1001.2101.3001.4242
https://blog.csdn.net/qq_43820692/article/details/112859426?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.control&dist_request_id=&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.control圖像文本生成之用于生成圖像描述的深度視覺語義對齊
Deep Visual-Semantic Alignments for Generating Image Descriptions(深度視覺-語義對應對于生成圖像描述)…h(huán)ttps://blog.csdn.net/weixin_30654419/article/details/99051284?utm_medium=distribute.pc_relevant.none-task-blog-baidujs_title-0&spm=1001.2101.3001.4242
多模態(tài)
https://blog.csdn.net/update7/article/details/112401228
OpenViDial:一個大規(guī)模多模態(tài)對話數據集
https://wenku.baidu.com/view/7bf3ea846394dd88d0d233d4b14e852458fb39de.html 多模態(tài)信息處理研究進展及趨勢 (里面有多模態(tài)數據集的構建)
MultiSynth基于多模態(tài)數據集的程序合成
https://cdmd.cnki.com.cn/Article/CDMD-10614-1020737068.htm基于多模態(tài)數據的文本摘要生成研究
中間遇到的問題隨筆
g.shape[:2] 取彩色圖片的長、寬。
如果img.shape[:3] 則取彩色圖片的長、寬、通道。
關于img.shape[0]、[1]、[2]
img.shape[0]:圖像的垂直尺寸(高度)
img.shape[1]:圖像的水平尺寸(寬度)
img.shape[2]:圖像的通道數
在矩陣中,[0]就表示行數,[1]則表示列數。
總結
- 上一篇: 关于汽车领域的知识图谱实战入门
- 下一篇: pytorch基础