零基础入门机器学习——声音识别——打卡Task1
生活随笔
收集整理的這篇文章主要介紹了
零基础入门机器学习——声音识别——打卡Task1
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
學習目標:
1 基于CNN的分類模型:參考圖片分類的形式,將不同聲音的頻譜做分類。
2 基于LSTM的分類模型:通過數據預處理、特征提取、劃分數據集以及訓練模型等步驟給聲音數據做分類。
學習內容:
1. 下載數據集
使用阿里云的天池資源,創建Data Science Workshop Notebook。
運行下列代碼進行下載
注釋:!的意思是用終端運行
環境要求:
-
TensorFlow版本:2.0+
-
Keras
Keras是一個高層神經網絡API,Keras由純Python編寫而成并基Tensorflow、Theano以及CNTK后端。Keras 為支持快速實驗而生,能夠把你的idea迅速轉換為結果。Kears的優勢:-
簡易和快速的原型設計(keras具有高度模塊化,極簡,和可擴充特性)
-
支持CNN和RNN,或二者的結合
-
無縫CPU和GPU切換
-
-
Sklearn
-
librosa
2. 導入庫
2.1基本庫
pandas, numpy, sklearn
2.1.導入分類模型所需要的庫
2.2 加載音頻處理庫
首先要安裝librosa
!pip install librosa --user然后導入其他庫
import os import librosa import librosa.display import glob3.跑通了!(慶祝)
這是特征提取
接下來我就獲取到了聲音的特征并輸出最終數據
在建立模型之前確定訓練集和測試集很重要
所以!
就把訓練集設為750,把測試集設為250吧!
我開始建立CNN模型
開始訓練啦!
(部分截圖)
預測測試集
這一部分我覺得是用來校驗訓練結果的,輸入預測集然后和預測集進行比較
學習時間:
2021年4月12日-4月14日學習路徑
阿里云天池新人賽,DataWhale
聲音識別入門
學習產出:
接觸了天池的DSW,對特征提取,模型建立有了初步的認識。 基本跑通了Baseline-1(CNN)。總結
以上是生活随笔為你收集整理的零基础入门机器学习——声音识别——打卡Task1的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 运用Nginx代理和UWSGI将Flas
- 下一篇: Djang重新整理migrations,