夜雨飄零 - 首頁

我的新書，《PaddlePaddle Fluid 深度學習入門與實戰》已出版！

2021-06-06 195 閱讀深度學習人工智能深度學習 PaddlePaddle 邊緣計算自然語言處理

本書詳細介紹瞭如何使用PaddlePaddle進行深度學習開發，涵蓋從環境搭建到實際項目應用的全過程。內容包括環境搭建、快速入門、線性迴歸算法、卷積神經網絡與循環神經網絡實戰、生成對抗網絡和強化學習等。此外，還講解了模型保存與使用、遷移學習以及移動端框架Paddle-Lite的應用等。本書適合初學者入門，並且能夠幫助解決實際問題，如花卉類型識別、新聞標題分類等項目。書中所有代碼均經過測試，配套資源

閱讀全文

基於Pytorch實現人臉關鍵點檢測模型MTCNN

2021-06-02 229 閱讀深度學習 Pytorch Pytorch 深度學習人臉識別計算機視覺

MTCNN是一種用於人臉檢測的多任務卷積神經網絡，由三層網絡P-Net、R-Net和O-Net組成。P-Net生成候選窗口；R-Net進行高精度篩選；O-Net輸出邊界框與關鍵點。模型採用候選框+分類器思想，並利用圖像金字塔、邊框迴歸等技術實現快速高效檢測。訓練MTCNN分爲三步： 1. 訓練PNet，生成PNet數據並使用`train_PNet.py`腳本進行； 2. 訓練RNet，生成RN

閱讀全文

基於MXNET實現的年齡性別識別

2021-04-07 203 閱讀深度學習深度學習 mxnet 年齡識別性別識別人臉檢測

這個項目是一個基於深度學習的人臉年齡和性別識別系統。它使用了OpenCV、MTCNN（多任務級聯卷積網絡）進行人臉檢測，以及一個預訓練的模型來進行年齡和性別的預測。下面我會簡要介紹如何運行和理解這些腳本。 ### 1. 環境準備確保你已經安裝了必要的Python庫： ```bash pip install numpy opencv-python dlib mtcnn ``` ### 2.

閱讀全文

基於PaddlePaddle 2.0動態圖實現的CRNN文字識別模型

2021-04-03 209 閱讀 PaddlePaddle 深度學習深度學習人工智能 PaddlePaddle crnn 文字識別

本文檔介紹基於PaddlePaddle 2.0動態圖實現的CRNN文字識別模型。該模型通過CNN提取特徵，RNN進行序列預測，並使用CTC Loss計算損失，適用於不規則長度圖片輸入。 **訓練與數據準備：** 1. **環境配置**: 需要安裝PaddlePaddle 2.0.1和Python 3.7。 2. **數據集生成**: - 使用`create_image.py`腳本自動生成驗

閱讀全文

基於PaddlePaddle2.0驗證碼端到端的識別

2021-03-23 219 閱讀 PaddlePaddle 深度學習 PaddlePaddle ocr crnn 圖像識別深度學習

你的代碼已經涵蓋了驗證碼識別項目的大部分內容，包括數據處理、模型訓練和推理。以下是對你提供的代碼進行的一些改進和完善建議： ### 1. 數據預處理確保圖像的尺寸一致（27x72），因爲這是你在訓練時使用的輸入尺寸。 ### 2. 模型定義你的 `Model` 類已經很好地封裝了網絡結構，但可以進一步優化和添加一些註釋以方便理解。 ### 3. 訓練過程在訓練過程中，確保使用多卡訓練時

閱讀全文

PPASR中文語音識別（入門級）

2021-03-16 229 閱讀 PaddlePaddle 深度學習語音深度學習 PaddlePaddle 人工智能語音識別中文語音識別

感謝你的詳細介紹！爲了進一步幫助大家理解和使用這個基於CTC的端到端中英文語音識別模型，我將從幾個方面進行補充和完善： ### 1. 數據集及其處理 #### AISHELL - **數據量**: 約20小時中文發音。 - **特點**: 包含普通話標準發音和部分方言。 #### Free ST Chinese Mandarin Corpus - **數據量**: 大約65小時中文發音。 -

閱讀全文

基於TNN在Android手機上實現圖像分類

2020-09-06 222 閱讀深度學習 Android 深度學習 Android tnn 圖像分類圖像識別

這個項目主要是基於TensorFlow Lite的圖像分類器，可以實現在Android設備上進行即時圖像識別。其主要功能和實現步驟如下： ### 項目結構 - **MainActivity.java**: 主界面實現了圖庫圖片選擇及即時攝像頭預測。 - **MNNClassification.java**: 集成並封裝了MNN模型相關操作。 ### 實現思路 1. **初始化**:

閱讀全文

基於MNN在Android手機上實現圖像分類

2020-09-05 256 閱讀深度學習 Android Android mnn 圖像識別 Tensorflow onnx

這是一個關於如何在Android應用中實現圖像分類的詳細指南。你已經成功地使用了TensorFlow Lite進行圖像分類，並展示瞭如何通過調用相機和選擇圖片兩種方式來獲取輸入數據，然後將這些數據傳遞給模型以進行預測。 ### 主要內容總結 1. **初始化模型**：首先加載預訓練好的`mobilenet_v2_1.0_224.tflite`模型，並創建一個分類器實例。 2. **讀取圖片並進

閱讀全文

一行代碼Android上實現人臉檢測、關鍵點檢測、口罩檢測

2020-09-05 227 閱讀 PaddlePaddle Android 深度學習 Android java 開發語言

本文介紹了使用Paddle Lite在Android應用中實現人臉檢測、關鍵點檢測和戴口罩檢測的方法。核心代碼僅一行，調用`FaceDetectionUtil.getInstance().predictImage(bitmap)`即可完成多項功能。該行代碼的背後，涉及模型的訓練與編譯，包括人臉檢測(`pyramidbox.nb`)、人臉關鍵點檢測(`facekeypoints.nb`)及口罩分類(

閱讀全文

基於insightface實現的人臉識別和人臉註冊

2020-08-30 286 閱讀深度學習人臉識別深度學習 mxnet 人工智能 insightface

這個代碼實現了一個基於深度學習的人臉識別系統，使用了InsightFace框架。它包含了人臉檢測、特徵提取和人臉識別的功能，並提供了註冊新用戶功能。下面是對代碼的詳細解釋： ### 1. 導入必要的庫 ```python import cv2 import numpy as np ``` ### 2. 定義 `FaceRecognition` 類這個類包含了所有與人臉識別相關的函數。

閱讀全文

Android基於圖像語義分割實現人物背景更換

2020-08-29 195 閱讀 PaddlePaddle Android PaddlePaddle Android 計算機視覺語義分割

你的項目已經實現了基本的人物圖像識別和背景替換功能。爲了進一步完善和優化你的代碼，我將提供一些改進建議，並給出一些示例代碼。 ### 1. 改進預測圖像的處理流程在預測結果轉換爲圖片的過程中，可以考慮使用 `Bitmap.createBitmap` 的構造函數直接從數組創建位圖，這樣可以減少不必要的臨時對象創建。此外，在繪製透明背景時可以直接利用 `Canvas` 和 `Paint` 來設置

閱讀全文

基於PaddlePaddle實現的目標檢測模型PP-YOLOE

2020-08-18 217 閱讀 PaddlePaddle 深度學習深度學習人工智能 PaddlePaddle 目標檢測計算機視覺

這段文檔詳細地介紹瞭如何使用 PaddlePaddle 實現目標檢測模型 PP-YOLOE 的訓練、評估、導出以及預測過程，並提供了多種部署方式，包括 Inference 預測接口、ONNX 接口和 Android 設備上的預測。以下是對各個部分的總結： ### 1. 訓練 - **單卡訓練**：使用 `python train.py --model_type=M --num_classes=8

閱讀全文

基於Paddle Lite在Android手機上實現圖像分類

2020-08-02 236 閱讀 PaddlePaddle Android 深度學習 PaddlePaddle Android 圖像識別人工智能深度學習

感謝您分享這個基於Paddle Lite進行圖像分類的Android應用開發實例。您的項目不僅涵蓋了如何從圖片中獲取類別，還介紹了通過攝像頭即時識別圖像的方法，這使得用戶可以在實際應用場景中快速瞭解被拍攝物體的信息。下面我將對您提供的內容做進一步優化和補充，並提供一些建議來改進用戶體驗或提高代碼效率： ### 1. 項目結構與資源管理確保項目中的文件結構清晰（如：`assets/image

閱讀全文

基於Pytorch實現的流式與非流式語音識別

2020-07-30 266 閱讀深度學習 Pytorch 語音 Pytorch 深度學習語音識別卷積神經網絡人工智能

### 項目概述該項目是基於PyTorch實現的一個語音識別系統。通過使用預訓練的模型和自定義配置，可以對輸入的音頻文件進行識別並輸出相應的文本結果。 ### 安裝依賴首先需要安裝必要的庫。可以在終端或命令行中運行以下命令： ```bash pip install torch torchaudio numpy librosa ``` 如果需要使用語音合成模塊，則還需安裝`gTTS`和

閱讀全文

基於Tensorflow2 Lite在Android手機上實現圖像分類

2020-07-22 257 閱讀 TensorFlow Android Tensorflow 計算機視覺 Android 圖像識別 Tensorflow lite

這個項目主要實現了一個基於TensorFlow Lite的圖像分類應用，能夠使用Android設備上的攝像頭或相冊中的圖片進行物體識別，並提供即時預測功能。以下是對該項目的核心步驟和關鍵代碼的詳細解析： ### 項目結構 - **TFLiteModel**: 包含模型相關配置。 - **MainActivity**: 主界面，用於啓動相機或選擇圖片進行分類。 - **RunClassifier

閱讀全文

基於MTCNN和MobileFaceNet實現的人臉識別

2020-07-19 240 閱讀深度學習 TensorFlow 人臉識別深度學習 Tensorflow MTCNN MobileFaceNet

你的項目設計了一個基於深度學習的人臉識別系統，並且提供了一個前後端分離的實現。這個系統包括了前端頁面和後端服務，可以用來進行人臉註冊和即時人臉識別。以下是對你代碼的一些詳細分析和改進建議： ### 前端部分 1. **HTML模板**: - 你已經在 `templates` 目錄下創建了一個簡單的 `index.html` 文件，用於提供用戶界面。 - 可以添加一些基本的CSS樣式

閱讀全文

基於Kersa實現的中文語音聲紋識別

2020-07-15 206 閱讀 TensorFlow 深度學習語音深度學習 Tensorflow Keras 聲紋識別說話人識別

感謝你提供的關於聲紋識別和對比的詳細說明。下面，我將爲你提供一個更詳細的PaddlePaddle版本的具體實現步驟，並附上代碼示例。這個項目將會包括數據預處理、模型訓練、聲紋對比和註冊與識別。 ### 1. 環境搭建首先確保你已經安裝了 PaddlePaddle 和其他必要的庫，如 `numpy`、`sklearn`等。可以通過以下命令進行安裝： ```bash pip install p

閱讀全文

基於Pyramidbox實現的大規模人臉檢測

2020-07-09 209 閱讀 PaddlePaddle 深度學習計算機視覺人工智能深度學習 PaddlePaddle 人臉識別

根據您提供的代碼和描述，這是一個基於PyTorch的面部檢測模型的實現。該模型使用了自定義的推理過程來加載圖像、進行預處理，並通過模型進行人臉檢測。以下是對代碼的一些關鍵點總結： - **數據預處理**：將輸入圖像從`HWC`轉置爲`CHW`格式，調整色彩空間（BGR到RBG），減去均值並縮放。這一步驟是爲了匹配訓練時的數據格式。 - **模型推理**：使用PaddlePaddle框架

閱讀全文

Mediapipe框架在Android上的使用

2020-07-08 249 閱讀 Android 深度學習 TensorFlow Android mediapipe 深度學習 Tensorflow

你的實現已經非常接近完成，但爲了確保一切都能正常工作，我將提供一個更完整的代碼示例，並進行一些改進和優化。此外，我會詳細解釋每個部分的作用。 ### 完整的代碼首先，我們需要導入必要的庫： ```java import android.content.pm.PackageManager; import android.os.Bundle; import android.view.Surfa

閱讀全文

基於PaddlePaddle實現的密度估計模型CrowdNet

2020-06-06 239 閱讀 PaddlePaddle 深度學習深度學習 PaddlePaddle 圖像識別計算機視覺

以上就是關於人流密度預測的詳細教程。通過這個項目，您可以瞭解如何使用PaddlePaddle來解決實際問題，並且從訓練到預測都有詳細的步驟指導。如果您在運行過程中遇到任何問題，或者有任何疑問，請隨時在評論區提問！我們也會持續關注反饋，以幫助更多想要進入AI領域的朋友們。希望這個案例能夠幫助大家更好地理解數據處理和模型訓練的過程。

閱讀全文

基於PaddlePaddle實現的目標檢測模型SSD

2020-06-02 195 閱讀 PaddlePaddle 深度學習人工智能深度學習 PaddlePaddle

### 項目概述該項目旨在使用 PaddlePaddle 實現 SSD (Single Shot Multibox Detector) 模型進行目標檢測任務。SSD 是一種單階段的目標檢測算法，能夠實現快速且精確的物體檢測。以下是詳細的代碼和配置文件解析。 --- ### 配置文件 `config.py` 解析 #### 重要參數 - **image_shape**: 輸入圖像的大小，默

閱讀全文

Python實現常見的排序算法

2020-05-16 287 閱讀其他排序算法算法 Python 排序算法

非常感謝您分享了這些排序算法的實現。爲了提供一個更加完善和易於理解的版本，我將對每種排序算法進行簡要解釋，並附上完整的代碼片段。此外，我還將在每個函數中加入必要的導入語句和註釋以提高代碼的可讀性。 ### 1. 冒泡排序冒泡排序是一種簡單的排序方法，它重複地遍歷要排序的列表，一次比較兩個元素，如果它們的順序錯誤就把他們交換過來。遍歷多次後，最大的元素就到了最後。 ```python def

閱讀全文

在Android實現雙目測距

2020-05-16 223 閱讀 Android opencv Android 計算機視覺 java

這個教程詳細介紹瞭如何使用Android設備的雙目攝像頭進行物體距離測量。下面是總結和進一步優化建議： ### 項目概述 1. **背景**：本文檔介紹了一個基於Android的雙目視覺系統，用於計算和展示圖像中物體的具體三維座標。 2. **目的**：通過攝像頭獲取左右眼視角的數據並利用Stereopsis技術（即立體視差法）來計算深度信息。 ### 項目結構 1. **圖片處理與分割*

閱讀全文

雙目攝像頭測量距離

2020-05-14 280 閱讀深度學習計算機視覺人工智能 opencv Python

這個代碼展示瞭如何使用OpenCV實現基於SGBM（Semiglobal Block Matching）算法的立體視覺深度估計，進而計算出圖像中的三維座標。以下是對代碼中關鍵步驟和參數的詳細解釋： ### 1. 準備工作首先導入必要的庫： ```python import cv2 import numpy as np ``` ### 2. 讀取並預處理圖像加載左眼和右眼的圖像，並進行

閱讀全文

基於PaddlePaddle實現聲紋識別

2020-05-05 221 閱讀 PaddlePaddle 深度學習語音深度學習人工智能 PaddlePaddle 聲紋識別

這個項目展示瞭如何使用PaddlePaddle實現基於語音識別的聲紋識別系統。整個項目涵蓋了從模型訓練、到推理以及用戶交互等多個環節，是一個完整的案例。以下是對你提供的代碼和內容的一些補充說明： ### 1. 環境搭建與依賴確保你的環境中已安裝了必要的庫： ```bash pip install paddlepaddle numpy scipy sounddevice ``` 對於音頻處理

閱讀全文