淺析機器學習的基本步驟

機器學習的基本步驟及實現(xiàn)方式比較

機器學習（Machine Learning）是計算機科學與人工智能的重要分支領域，也是大數(shù)據(jù)時代的一個重要技術。機器學習的基本思路是模仿人類的學習行為過程，該技術主要采用的算法包括聚類、分類、決策樹、貝葉斯、神經(jīng)網(wǎng)絡、深度學習等。總體而言，機器學習是讓計算機在大量數(shù)據(jù)中尋找數(shù)據(jù)規(guī)律，并根據(jù)數(shù)據(jù)規(guī)律對未知或主要數(shù)據(jù)趨勢進行最終預測。在機器學習中，機器學習的效率在很大程度上取決于它所提供的數(shù)據(jù)集，數(shù)據(jù)集的大小和豐富程度也決定了最終預測的結果質(zhì)量。目前在算力方面，量子計算能超越傳統(tǒng)二進制的編碼系統(tǒng)，利用量子的糾纏與疊加特性拓展其對大量數(shù)據(jù)的運算處理能力，從而能得出更準確的模型參數(shù)以解決一些或工業(yè)或網(wǎng)絡的現(xiàn)實問題。

1.數(shù)據(jù)階段

1.1數(shù)據(jù)收集與預處理

互聯(lián)網(wǎng)時代，每分每秒中都有大量的數(shù)據(jù)信息產(chǎn)生。大量的數(shù)據(jù)如同養(yǎng)料一般，沒有源源不斷地數(shù)據(jù)供應，以數(shù)據(jù)為基礎發(fā)展起來的各種技術如同無源之水缺少發(fā)展的活力。數(shù)據(jù)采集技術已經(jīng)有了階段性的發(fā)展，成熟度相對較高。因此，在提及機器學習、深度學習、自然語言處理等人工智能技術時，數(shù)據(jù)采集常常被忽略。

數(shù)據(jù)采集技術也造就了許多以采集數(shù)據(jù)為主要業(yè)務的產(chǎn)品與應用，如作為Hadoop的組件的Flume、開源的數(shù)據(jù)收集架構Fluentd、Python的爬蟲架構Scrapy等。還有一些數(shù)據(jù)收集服務平臺如百度統(tǒng)計、阿里云、大數(shù)據(jù)采集工具八爪魚。

盡管數(shù)據(jù)時代不缺少數(shù)據(jù)，但有價值信息的數(shù)據(jù)即有效數(shù)據(jù)還需要對大量無序的數(shù)據(jù)進行數(shù)據(jù)預處理。未經(jīng)過數(shù)據(jù)處理的數(shù)據(jù)往往存在以下問題：

數(shù)據(jù)不完整：缺少屬性值或僅僅包含聚集數(shù)據(jù)；

數(shù)據(jù)含噪聲：大量數(shù)據(jù)中包含錯誤或偏離期望的離群值；

數(shù)據(jù)標簽規(guī)則不一：對于數(shù)據(jù)的分類規(guī)則與標準不一致，導致最終收集的數(shù)據(jù)不屬于同類數(shù)據(jù)。

數(shù)據(jù)預處理的方法主要有以下幾種：

數(shù)據(jù)清洗：對數(shù)據(jù)進行清洗，以去除噪聲、無關數(shù)據(jù)、完整性及其欠缺的數(shù)據(jù)、補充輕微缺損的數(shù)據(jù)；

數(shù)據(jù)集成：數(shù)據(jù)集成多為數(shù)據(jù)分析的一個環(huán)節(jié)，數(shù)據(jù)集成將多個數(shù)據(jù)源中的數(shù)據(jù)結合、存放在一個一致的數(shù)據(jù)存儲，如數(shù)據(jù)倉庫中，這些數(shù)據(jù)源可能包括多個數(shù)據(jù)庫、數(shù)據(jù)方或一般文件；

數(shù)據(jù)規(guī)約：數(shù)據(jù)歸約技術可以用來得到數(shù)據(jù)集的歸約表示，可以盡可能保持原數(shù)據(jù)的完整性，因而在歸約后的數(shù)據(jù)集上挖掘?qū)⒏行Вa(chǎn)生幾乎相同的分析結果。

1.2數(shù)據(jù)集準備

數(shù)據(jù)集準備是使用TensorFlow、Paddle Quantum等進行機器學習的入門基礎。在實際練習或使用過程中，企業(yè)的數(shù)據(jù)相對而言獲取渠道固定、有較清晰的分類，因此在準備數(shù)據(jù)集時，做好分類后只需要將數(shù)據(jù)文件轉為機器學習可識別的文件即可。個人練習過程中，數(shù)據(jù)獲取難度較大，可參考KDnuggets上發(fā)表的一篇文章，作者總結了七十多個免費的數(shù)據(jù)集（http://t.cn/RQJhwSi）。

經(jīng)處理后的數(shù)據(jù)制備為數(shù)據(jù)集。數(shù)據(jù)集一般可以分為訓練集、驗證集、測試集。其中，訓練集主要用于訓練模型；驗證集主要用于選擇模型，通常在訓練過程中使用訓練集確定一些超參數(shù)；測試集主要用于判斷網(wǎng)絡性能的好壞。

數(shù)據(jù)集的劃分方法一般也為三種，即留出法、交叉驗證法、自助法。留出法是指將數(shù)據(jù)集 D 劃分成兩份互斥的數(shù)據(jù)集，一份作為訓練集 S，一份作為測試集 T，在 S 上訓練模型，在 T 上評估模型效果。留出法的優(yōu)點是簡單好實現(xiàn)，但訓練集和測試集數(shù)據(jù)分布不一致時易引入偏差，最終影響數(shù)據(jù)模型評估結果。交叉驗證法是將數(shù)據(jù)集D劃分為n個互斥的子集。然后每次選用一份數(shù)據(jù)子集作為測試集，其余的 n-1 份數(shù)據(jù)子集作為訓練集，迭代n輪得到n個模型，最后將n次的評估結果匯總求平均值得到最終的評估結果。自助法使用有放回的重復采樣方式進行訓練集、測試集的構建。自助采樣即確定所獲取的訓練集樣本數(shù)n后，從數(shù)據(jù)集D中有放回的采樣n次，得到n條樣本的訓練集，最后將未出現(xiàn)過的樣本作為測試集。

2.模型階段

2.1機器學習算法建模

機器學習可為監(jiān)督學習、無監(jiān)督學習和強化學習三類。監(jiān)督學習是指有標簽數(shù)據(jù)、可進行直接反闊并預測結果的一種學習方式，其主要目標是從有標簽的訓練數(shù)據(jù)中學習模型，從而對未知的數(shù)據(jù)做出預測。無監(jiān)督學習是指數(shù)據(jù)沒有標簽且數(shù)據(jù)結構不明確或無數(shù)據(jù)結構的。無監(jiān)督學習技術主要目的是在沒有已知結果變量或獎勵函數(shù)的指導下，探索數(shù)據(jù)結構、提取有價值的信息。強化學習的主要目的是開發(fā)一個系統(tǒng)，然后通用該系統(tǒng)與環(huán)境之間發(fā)生交互產(chǎn)生的數(shù)據(jù)信息提高系統(tǒng)性能。強化學習（RL）分反饋是通過獎勵函數(shù)對行動度量的結果，常見的強化學習場景如國際象棋、制造機器人、管理生產(chǎn)規(guī)劃、企業(yè)決策、物流、電路設計、控制自動駕駛汽車、控制無人機等等。

2.2模型訓練

模型訓練需要進行多輪迭代，每輪迭代需要遍歷一次訓練數(shù)據(jù)集并從中獲取小批量樣本。獲取樣本后將樣本數(shù)據(jù)輸入模型中得到預測值，對比預測值與真實值之間的損失函數(shù)（loss）。在得到損失函數(shù)以后，開始執(zhí)行梯度反向傳播并根據(jù)設置的優(yōu)化算法更新模型參數(shù)。最后模型的訓練效果可通過損失函數(shù)值的變化來判斷，當損失函數(shù)呈減小趨勢，模型訓練效果越顯著。以spam數(shù)據(jù)集為例：

將數(shù)據(jù)分為訓練集和測試集并擬合模型

##codes from https://cloud.tencent.com/developer/article/1787782

library(caret)
library(kernlab)
data(spam)
inTrain <- createDataPartition(y = spam$type,
                               p = 0.75, list = FALSE) 
training <- spam[inTrain, ]
testing <- spam[-inTrain, ]
modelFit <- train(type ~., data = training, method="glm")

查看選項：metric選項設置算法評價，連續(xù)變量結果為均方根誤差RMSE；R^2^（從回歸模型獲得）分類變量結果為準確性；Kappa系數(shù)（用于一致性檢驗，也可以用于衡量分類精度）

##codes from https://cloud.tencent.com/developer/article/1787782

args(train.default)
function(x, y, method = "rf", preProcess = NULL, ..., weights = NULL,
         metric = ifelse(is.factor(y), "Accuracy", "RMSE"), maximize = ifelse(metric == "RMSE", FALSE, TRUE),
         trControl = trainControl(), tuneGrid = NULL, tuneLength = 3)
NULL

args(trainControl)
function (method = "boot", number = ifelse(grepl("cv", method), 
    10, 25), repeats = ifelse(grepl("[d_]cv$", method), 1, NA), 
    p = 0.75, search = "grid", initialWindow = NULL, horizon = 1, 
    fixedWindow = TRUE, skip = 0, verboseIter = FALSE, returnData = TRUE, 
    returnResamp = "final", savePredictions = FALSE, classProbs = FALSE, 
    summaryFunction = defaultSummary, selectionFunction = "best", 
    preProcOptions = list(thresh = 0.95, ICAcomp = 3, k = 5, 
        freqCut = 95/5, uniqueCut = 10, cutoff = 0.9), sampling = NULL, 
    index = NULL, indexOut = NULL, indexFinal = NULL, timingSamps = 0, 
    predictionBounds = rep(FALSE, 2), seeds = NA, adaptive = list(min = 5, 
        alpha = 0.05, method = "gls", complete = TRUE), trim = FALSE, 
    allowParallel = TRUE) 
NULL

trainControl控制訓練方法:設置重抽樣方法，boot：bootstrapping自舉法，boot632：調(diào)整的自舉法，cv：交叉驗證 repeatedcv：重復交叉驗證，LOOCV：留一交叉驗證；number選項設置交叉驗證或自舉重抽樣的次數(shù)；repeats選項設置重復交叉驗證的重復次數(shù)；seed選項設置隨機數(shù)種子，可以設置全局隨機數(shù)種子，也可為每次重抽樣設置隨機數(shù)種子。

##codes from https://cloud.tencent.com/developer/article/1787782

set.seed(1235)
modekFit2 <- train(type ~., data = training, method = "glm")
modekFit2
Generalized Linear Model

3451 samples
  57 predictor
   2 classes: 'nonspam', 'spam'

No pre-processing
Resampling: Bootstrapped (25 reps) 
Summary of sample sizes: 3451, 3451, 3451, 3451, 3451, 3451, ... 
Resampling results:

  Accuracy   Kappa    
  0.9156324  0.8229977

2.3模型評估與優(yōu)化

在機器學習的算法模型中，參數(shù)包括兩類分別為模型參數(shù)和超參數(shù)。其中模型參數(shù)不能人為預先設置，而是通過模型訓練過程中自動生成與更新。另一類參數(shù)為超參數(shù)。超參數(shù)在模型訓練之前就可認為設定，是控制模型結構、功能、效率的一個調(diào)節(jié)入口。模型訓練過程中產(chǎn)生的損失函數(shù)是進行模型評估的一個指標，在模型訓練過程結束后，可根據(jù)得到的各指標值對模型進行評估與優(yōu)化。模型優(yōu)化中涉及到一個超參數(shù)概念，是指在建模時將一些與模型無關的未知量設置為固定參數(shù)。常見超參數(shù)有學習效率、迭代次數(shù)（epoches）、隱層數(shù)目、隱層單元數(shù)、激活函數(shù)、優(yōu)化器等。

2.4預測或推理

機器學習的預測即在模型中輸入一個預測值，通過模型計算可以得到對應的輸出值，該值即為模型的預測結果。簡單的模型如一般簡單線性回歸y=kx+b。真實值分布在線性模型兩側，輸入一個對應的x值即得到一個對應的y值。

3.SVM算法示例

SVM是一類有監(jiān)督的分類算法，該算法思想主要為：首先假設樣本空間上有兩類樣本點，SVM算法核心是希望找到一個超平面將兩類樣本分開；在尋找劃分超平面時應盡可能使得兩類樣本到超平面距離最短。

首先，導入依賴，準備算法運行環(huán)境

import qiskit
import matplotlib.pyplot as plt
import numpy as np
from qiskit.ml.datasets import ad_hoc_data
from qiskit import BasicAer
from qiskit.aqua import QuantumInstance
from qiskit.circuit.library import ZZFeatureMap
from qiskit.aqua.algorithms import QSVM
from qiskit.aqua.utils import split_dataset_to_data_and_labels, map_label_to_class_name

其次，加載并查看數(shù)據(jù)

feature_dim = 2
training_dataset_size = 20
testing_dataset_size = 10
random_seed = 10598
shot = 10000
sample_Total, training_input, test_input, class_labels = ad_hoc_data(training_size=training_dataset_size,
                                                                    test_size=testing_dataset_size,
                                                                    gap=0.3,
                                                                    n=feature_dim,
                                                                    plot_data=True)
datapoints, class_to_label = split_dataset_to_data_and_labels(test_input)
print(class_to_label)

方式一：采用量子后端的方式運行SVM算法

使用'qasm_simulator'作為算法后端

#getting my backend
backend = BasicAer.get_backend('qasm_simulator')
feature_map = ZZFeatureMap(feature_dim, reps=2)
svm = QSVM(feature_map,training_input,test_input,None)
svm.random_seed = random_seed
quantum_instance = QuantumInstance(backend,shots=shot,seed_simulator=random_seed, seed_transpiler=random_seed)
result = svm.run(quantum_instance)

打印訓練中的核心矩陣

print("kernel matrix during the training:")
kernel_matrix = result['kernel_matrix_training']
img = plt.imshow(np.asmatrix(kernel_matrix),interpolation='nearest',origin='upper',cmap='bone_r')

獲得預測及其精度

predicted_labels = svm.predict(datapoints[0])
predicted_classes = map_label_to_class_name(predicted_labels,svm.label_to_class)
print('ground truth: {}'.format(datapoints[1]))
print('prediction: {}'.format(predicted_labels))
print('testing success ratio: ', result['testing_accuracy'])

輸出預測結果

ground truth: [0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1]
prediction: [0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1]
testing success ratio:  1.0

由以上輸出可看出，采用量子方式運算SVM算法的精度結果為100%。

方式二：采用經(jīng)典方式運行SVM算法

使用qiskit中的一個類似Scikit-learn實現(xiàn)

from qiskit.aqua.algorithms import SklearnSVM
svm_classical = SklearnSVM(training_input, test_input)
result_classical = svm_classical.run()

打印經(jīng)典方式訓練中的kernel matrix

print("kernel matrix during the training:")
kernel_matrix_classical = result['kernel_matrix_training']
img = plt.imshow(np.asmatrix(kernel_matrix_classical),interpolation='nearest',origin='upper',cmap='bone_r')

打印預測結果及精度

predicted_labels_classical = svm_classical.predict(datapoints[0])
predicted_classes_classical = map_label_to_class_name(predicted_labels,svm.label_to_class)
print('ground truth: {}'.format(datapoints[1]))
print('prediction: {}'.format(predicted_labels_classical))
print('testing success ratio: ', result_classical['testing_accuracy'])

采用經(jīng)典方式的SVM算法輸出結果如下：

ground truth: [0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1]
prediction: [1. 0. 0. 1. 0. 0. 0. 0. 1. 0. 1. 1. 1. 0. 0. 0. 0. 1. 1. 1.]
testing success ratio:  0.65

由以上輸出可看出，采用經(jīng)典方式運算SVM算法的精度結果為65%。

在SVM算法的分類中，尋找可劃分兩類樣本的超平面通常只能在更高維度上進行，這就涉及到計算高維空間中的樣本點與平面之間的距離。因此，當維度非常大時，樣本點與超劃分平面的距離計算耗費將很大。而內(nèi)核計算可以獲取數(shù)據(jù)點后返回一個距離，并可以通過優(yōu)化內(nèi)核使樣本點到超平面的距離最大化。這時，量子計算的高效率的計算模式就體現(xiàn)出其優(yōu)越性，該示例在一定程度上說明了QSVM優(yōu)于SVM。

編輯：黃飛

閱讀全文

人工智能(229987) 人工智能(229987)
SVM(32126) SVM(32126)
機器學習(130423) 機器學習(130423)
量子計算(34267) 量子計算(34267)

學習STM32啟動代碼的方法步驟

2021-11-29 06:34:12

學習單片機的步驟

學習單片機必備的八大步驟

2021-02-01 06:30:05

學習單片機的幾個步驟

學習單片機的八個步驟

2021-04-02 06:09:14

機器學習與軟件平臺的融合

本文將探討機器學習與軟件平臺的融合。

2021-01-28 06:36:35

機器學習入門篇：一個完整的機器學習項目

機器學習項目入門篇：一個完整的機器學習項目

2020-05-11 14:47:49

機器學習的創(chuàng)新/開發(fā)和應用能力

機器學習的未來在工業(yè)領域采用機器學習機器學習和大數(shù)據(jù)工業(yè)人工智能生態(tài)系統(tǒng)

2020-12-16 07:47:35

機器學習的基礎內(nèi)容

文檔文章目錄系列文章目錄前言一、pandas是什么？二、使用步驟1.引入庫2.讀入數(shù)據(jù)總結前言提示：這里可以添加本文要記錄的大概內(nèi)容：例如：隨著人工智能的不斷發(fā)展，機器學習這門技術也越來越重要，很多人都開啟了學習機器學習，本文就介紹了機器學習的基礎內(nèi)容。提示：以下是本篇文章正文內(nèi)容，下面案例

2022-02-09 06:47:38

機器學習的基礎內(nèi)容

文章目錄前言一、pandas是什么？二、使用步驟1.引入庫2.讀入數(shù)據(jù)總結前言提示：這里可以添加本文要記錄的大概內(nèi)容：例如：隨著人工智能的不斷發(fā)展，機器學習這門技術也越來越重要，很多人都開啟了學習機器

2021-08-20 08:07:49

機器學習的基礎內(nèi)容

：隨著人工智能的不斷發(fā)展，機器學習這門技術也越來越重要，很多人都開啟了學習機器學習，本文就介紹了機器學習的基礎內(nèi)容。提示：以下是本篇文章正文內(nèi)容，下面案例可供參考一、hc6800-es v2.0示例：pandas 是基于NumPy 的一種工具，該工具是為了解決數(shù)據(jù)分析任務而創(chuàng)建的。二、使用步

2021-11-24 06:00:24

機器學習的基礎內(nèi)容介紹

2022-01-12 08:12:18

機器學習的基礎內(nèi)容大合集

，機器學習這門技術也越來越重要，很多人都開啟了學習機器學習，本文就介紹了機器學習的基礎內(nèi)容。提示：以下是本篇文章正文內(nèi)容，下面案例可供參考一、位帶操作二、使用步驟1.引入庫代碼如下（示例）：import numpy as npimport pandas as pdimport

2022-01-07 06:35:58

機器學習的基礎內(nèi)容匯總

人工智能的不斷發(fā)展，機器學習這門技術也越來越重要，很多人都開啟了學習機器學習，本文就介紹了機器學習的基礎內(nèi)容。提示：以下是本篇文章正文內(nèi)容，下面案例可供參考一、pandas是什么？示例：pandas 是基于NumPy 的一種工具，該工具是為了解決數(shù)據(jù)分析任務而創(chuàng)建的。二、使用步驟1.引入庫代碼

2022-02-28 06:12:58

機器學習的未來

機器學習的未來在工業(yè)領域采用機器學習機器學習和大數(shù)據(jù)

2021-01-27 06:02:18

機器學習的相關資料下載

https://www.toutiao.com/a6712245202418926083/機器學習最重要的應用之一是嵌入式機器視覺領域，各類系統(tǒng)正在從視覺使能系統(tǒng)演進為視覺引導自動化系統(tǒng)。嵌入式視覺

2021-12-14 07:03:28

機器學習的資源分享

機器學習資源分享

2020-06-09 16:31:04

機器學習簡介與經(jīng)典機器學習算法人才培養(yǎng)

上課時間安排：2022年05月27日 — 2022年05月30日No.1 第一天一、機器學習簡介與經(jīng)典機器學習算法介紹什么是機器學習？機器學習框架與基本組成機器學習的訓練步驟機器學習問題的分類

2022-04-28 18:56:07

機器學習算法分享

機器學習算法（1）——Logistic Regression

2020-06-09 13:30:03

機器學習算法如何用于制造無人駕駛汽車？

機器學習算法如何用于制造無人駕駛汽車

2021-03-18 06:27:18

機器人技術和機器學習

機器人技術和機器學習正成為嵌入式系統(tǒng)硬件和軟件供應商的下一個重大事件。嵌入式系統(tǒng)可以通過網(wǎng)絡連接和物聯(lián)網(wǎng)（IoT）來傳遞信息、共享資源。無論是智能，低能耗，邊緣設備，中間網(wǎng)關還是計算節(jié)點，都需要

2021-12-20 06:03:10

機器人操作系統(tǒng)淺析

2016-09-28 11:43:46

機器人工程師學習計劃

如何定義機器人？機器人工程師學習計劃分享

2021-12-20 06:11:57

淺析為Windows on Arm設置Tensorflow的步驟

1、為Windows on Arm設置TensorflowTensorflow是當今使用的主流機器學習框架之一。它通常通過使用Bazel構建的Python包分發(fā)。在撰寫本文時，沒有官方軟件包可供

2022-08-10 15:42:13

淺析如何學習基于ARM平臺的嵌入式系統(tǒng)

2012-08-18 11:03:44

淺析嵌入式學習步驟

嵌入式Linux要學哪些？一些人總在尋思，怕走了彎路，又怕學的東西離企業(yè)需求遠。那么今天就請華清遠見高級講師曹大神告訴你，9點淺析嵌入式學習步驟。下面是他本人親筆。1、要學習Linux，首先要會用

2021-11-05 08:05:08

淺析算法引起的serialno值相同

1、淺析算法引起的serialno值相同　　Platform： RK3288　　OS： Android 6.0　　Kernel： 3.10.92　　現(xiàn)象：　　在前面已經(jīng)解決了緩存文件引起值相同

2022-11-16 17:33:22

ARM學習的資料和步驟

本人是大二的學生，現(xiàn)在準備學習嵌入式，請問大家我應該先學些什么，具體步驟怎樣？還有能不能提供一些學習資料給小弟？

2012-03-22 12:43:36

Edge Impulse的分類模型淺析

Edge Impulse是一個應用于嵌入式領域的在線的機器學習網(wǎng)站，不僅為用戶提供了一些現(xiàn)成的神經(jīng)網(wǎng)絡模型以供訓練，還能直接將訓練好的模型轉換成能在單片機MCU上運行的代碼，使用方便，容易上手。本文

2021-12-20 06:51:26

FPGA學習步驟

本帖最后由 eehome 于 2013-1-5 09:47 編輯 FPGA學習步驟

2012-08-12 13:36:59

Labview機器學習

請問Labview機器學習工具箱里有SVM，BP等工具，如果自己用SVR做了一個回歸，可以用Labview實現(xiàn)嗎？這方面的小白，跟各位老師請教一下

2019-10-28 11:11:09

MATLAB圖像處理及機器學習入門交流

深度學習交流大群： 372526178 （課件資料共享，加群備注楊春嬌邀請）MATLAB與機器學習大群: 626611806 （加群備注楊春嬌邀請）

2018-09-12 10:44:56

Microchip的機器學習開發(fā)工具有哪些

Microchip的機器學習開發(fā)工具

2020-11-25 07:58:55

NanoEdgeAIStudio機器學習（ML）技術相關資料介紹

NanoEdge? AI Studio（NanoEdgeAIStudio）是一種新的機器學習（ML）技術，可輕松為最終用戶帶來真正的創(chuàng)新。只需幾個步驟，開發(fā)人員就可以基于最少量的數(shù)據(jù)為其項目創(chuàng)建最佳的 ML 庫。

2022-11-29 07:37:53

Python機器學習入門之pandas的使用提示

2021-08-13 07:36:45

STM32單片機學習步驟有哪些

2021-10-13 09:23:14

pandas的使用步驟有哪些呢

2022-01-12 07:18:32

pandas的定義及使用步驟

2021-08-24 07:10:39

tensorflow機器學習日志

tensorflow學習日志(四)機器學習（泛化,過擬合, 數(shù)據(jù)集，驗證集，測試集）

2020-04-14 06:32:33

【下載】《機器學習》+《機器學習實戰(zhàn)》

`1.機器學習簡介：機器學習是計算機科學與人工智能的重要分支領域. 本書作為該領域的入門教材，在內(nèi)容上盡可能涵蓋機器學習基礎知識的各方面。為了使盡可能多的讀者通過本書對機器學習有所了解, 作者試圖

2017-06-01 15:49:24

人工智能和機器學習的前世今生

摘要：閱讀本文以了解更多關于人工智能、機器學習和深度學習方面的知識，以及它們對商業(yè)化意味著什么。如果正確的利用模式識別進行商業(yè)預測和決策，那么會為企業(yè)帶來巨大的利益。機器學習（ML）研究這些模式

2018-08-27 10:16:55

什么是機器學習? 機器學習基礎入門

的指導下，這個過程從數(shù)據(jù)開始。也就是說，我們嵌入式系統(tǒng)產(chǎn)生的大量數(shù)據(jù)。機器學習開發(fā)過程的第一步是收集數(shù)據(jù)，并在數(shù)據(jù)輸入模型之前對其進行標記。標記是一個關鍵的分類步驟，也是我們將一組輸入與預期輸出關聯(lián)起來

2022-06-21 11:06:37

什么是TinyML？微型機器學習

了解一個叫做微型機器學習(Tiny Machine Learning，TinyML)的機器學習分部，它是什么，它的應用，硬件和軟件需求，以及它的好處。機器學習(ML)是計算機科學中一個動態(tài)而強大

2022-04-12 10:20:35

介紹機器學習的基礎內(nèi)容

參考右邊的幫助文檔文章目錄嵌入式系統(tǒng)之硬件總復習前言一、pandas是什么？二、使用步驟1.引入庫2.讀入數(shù)據(jù)總結前言提示：這里可以添加本文要記錄的大概內(nèi)容：例如：隨著人工智能的不斷發(fā)展，機器學習這門技術也越來越重要，很多人都開啟了學習機器學習，本文就介紹了機器學習的基礎內(nèi)容。提示：以下是本篇文

2021-12-16 06:27:44

介紹機器學習的基礎內(nèi)容

2021-08-13 07:39:46

關于機器學習的日志

機器學習日志

2020-07-08 12:54:25

分析一個不錯的機器學習項目簡歷收集冊

2021-09-26 06:03:10

創(chuàng)建一個邊緣機器學習系統(tǒng)

本指南適用于系統(tǒng)設計人員，可能使用Arm Flexible access程序。本指南將幫助您開發(fā)可以執(zhí)行機器學習的片上系統(tǒng)(SoC)在邊緣。本指南中介紹的SoC可以處理與機器學習相關的任務圖像識別

2023-08-02 11:02:42

可解釋的機器學習——打開機器學習黑匣子

【資源下載】《可解釋的機器學習》，打開機器學習黑匣子

2020-05-20 14:16:57

如何學習單片機？學習單片機有哪些步驟？

為什么要學習51單片機？如何學習單片機？學習單片機有哪些步驟？

2021-10-12 07:07:17

如何學習單片機？學習單片機有哪些步驟？

2021-04-19 07:42:29

如何學習機器學習

【吳恩達機器學習】學習筆記13（Normal Equation& 與梯度下降比較）

2020-04-26 11:05:59

如何用卷積神經(jīng)網(wǎng)絡方法去解決機器監(jiān)督學習下面的分類問題？

人工智能下面有哪些機器學習分支？如何用卷積神經(jīng)網(wǎng)絡（CNN）方法去解決機器學習監(jiān)督學習下面的分類問題？

2021-06-16 08:09:03

如果只是應用機器學習，而不是研究，需要哪些知識

如果只是應用機器學習，而不是研究，需要哪些知識？還用深入學習數(shù)字么

2019-08-30 14:51:02

嵌入式學習步驟及方法

新手必備嵌入式學習步驟及方法詳細解說

2021-01-14 07:45:35

嵌入式學習步驟的三個階段

[嵌入式系統(tǒng)無疑是當前國內(nèi)最熱門的技術之一，但是該如何來學好嵌入式系統(tǒng)？好的學習方法是前提，但正確的學習步驟依然不可缺少，分享一下比較主流的嵌入式學習步驟，對不知該從哪里開始學習和入手的朋友都會有一定的幫助，可以為你指點迷經(jīng)。嵌入式學習步驟主要分為三個階段

2021-01-14 07:25:13

微型機器學習

人工智能 AI 正在加快速度從云端走向邊緣，進入到越來越小的物聯(lián)網(wǎng)設備中。而這些物聯(lián)網(wǎng)設備往往體積很小，面臨著許多挑戰(zhàn)，例如功耗、延時以及精度等問題，傳統(tǒng)的機器學習模型無法滿足要求，那么微型機器學習又如何呢？

2021-09-15 09:23:12

最值得學習的機器學習編程語言

如果你對人工智能和機器學習感興趣，而且正在積極地規(guī)劃著自己的程序員職業(yè)生涯，那么你肯定面臨著一個問題：你應該學習哪些編程語言，才能真正了解并掌握 AI 和機器學習？可供選擇的語言很多，你需要通過戰(zhàn)略

2021-03-02 06:22:38

物聯(lián)網(wǎng)防火墻與機器學習技術解析

物聯(lián)網(wǎng)防火墻與機器學習技術

2021-02-25 06:05:58

請問一下如何去打造一種機器學習流水線？

如何去打造一種機器學習流水線？有哪些步驟？

2021-07-14 06:26:29

部署基于嵌入的機器學習模型

1、如何在生產(chǎn)中部署基于嵌入的機器學習模型　　由于最近大量的研究，機器學習模型的性能在過去幾年里有了顯著的提高。雖然這些改進的模型開辟了新的可能性，但是它們只有在可以部署到生產(chǎn)應用中時才開始提供真正

2022-11-02 15:09:52

電腦對機器機升級步驟

電腦對機器機升級步驟:華亞電腦對機器升級步驟，海爾電腦對機升級步驟，國芯升級步驟。

2010-01-14 17:07:49

淺析基于數(shù)據(jù)加密的網(wǎng)絡通信系統(tǒng)的設計與應用

淺析基于數(shù)據(jù)加密的網(wǎng)絡通信系統(tǒng)的設計與應用，很好的網(wǎng)絡通信資料，快來學習吧。

2016-04-19 11:30:48

Spark機器學習庫的各種機器學習算法

本文將簡要介紹Spark機器學習庫（Spark MLlibs APIs）的各種機器學習算法，主要包括：統(tǒng)計算法、分類算法、聚類算法和協(xié)同過濾算法，以及各種算法的應用。你不是一個數(shù)據(jù)科學家。根據(jù)

2017-09-28 16:44:43

從零到python機器學習大神的7個步驟

有許多python機器學習資源在線免費提供，從哪開始?如何進行?從零到python機器學習大神只要7個步驟。入門，在英語中最打擊人的兩個單詞，第一部往往是最難的，當在這方面有太多選擇,通常

2017-11-15 12:29:35

12816

什么是機器學習？機器學習能解決什么問題？（案例分析）

隨著大數(shù)據(jù)時代的到來，機器學習成為解決問題的一種重要且關鍵的工具。不管是工業(yè)界還是學術界，機器學習都是一個炙手可熱的方向，但是學術界和工業(yè)界對機器學習的研究各有側重，學術界側重于對機器學習

2018-05-18 13:13:00

15976

如何開始接觸機器學習_機器學習入門方法盤點

機器學習入門方法一說到機器學習，我被問得最多的問題是：給那些開始學習機器學習的人的最好的建議是什么？

2018-05-20 07:10:00

3755

思考機器學習的方法及機器學習帶來的影響

機器學習會是一個步驟，改變我們可以用計算機做的事情。它將是不同的公司的不同產(chǎn)品的一部分。最終，幾乎所有的東西里面都會有機器學習，也沒有人會去在意。

2018-07-13 09:56:02

3781

淺析機器學習建模中常見的7個誤區(qū)

Cheng-Tao Chu總結了機器學習建模中常見的誤區(qū)，提醒讀者注意算法的假定未必適合手頭的數(shù)據(jù)。

2018-07-28 09:27:49

3330

淺析四類機器學習在自動駕駛中的應用

自動駕駛中機器學習算法主要分為四類，即決策矩陣算法、聚類算法、模式識別算法和回歸算法。我們跟他一起看看，這些算法都是怎樣應用的。

2018-11-05 17:47:00

5146

深度學習與機器人之間的關系淺析

迄今為止，大多數(shù)人工智能（AI）研究都集中在視覺方面。多虧了機器學習，尤其是深度學習，我們現(xiàn)在有了對周圍環(huán)境有很好的視覺理解的機器人和設備。但我們不要忘記，視覺只是人類的一種生物感官。為了更好地模擬

2018-12-21 09:38:26

2460

淺析如何在人工智能中機器學習

機器學習是使用計算機來彰顯數(shù)據(jù)背后的真實含義，它為了把無序的數(shù)據(jù)轉換成有用的信息。

2019-04-05 13:41:00

877

如果要從事機器學習方面的研發(fā)，可以按照以下幾個步驟學習

具備軟件開發(fā)能力的程序員，轉向機器學習領域會更容易一些，但是即使沒有軟件開發(fā)基礎，如果具備扎實的數(shù)學基礎以及較強的學習能力，也完全可以從頭開始學習。對于沒有軟件開發(fā)基礎的人來說，如果要從事機器學習方面的研發(fā)，可以按照以下幾個步驟學習：

2019-09-20 10:26:03

2988

Java程序員把機器學習作為主攻方向，未來會有更多的發(fā)展機會

對于Java程序員來說，要想轉向機器學習，首先要了解機器學習的概念和步驟，然后根據(jù)自身的知識結構來補學相應的知識。機器學習的步驟包括數(shù)據(jù)的收集、整理、算法設計、算法實現(xiàn)、算法訓練、算法驗證和算法應用

2019-09-20 11:27:41

2347

深度學習與機器閱讀

隨后，以傳統(tǒng)機器閱讀的方法作為引入，引出了深度學習的方法。先介紹了機器閱讀的主要步驟：文本表示（將文本表示成機器能理解的符號）→ 語義匹配（尋找問題和原文句子的語義關聯(lián)） → 理解推理（對語義關聯(lián)進行加工和推理） → 結果推薦（對候選答案進行排序和輸出）。

2019-09-20 16:01:16

3105

機器學習模型切實可行的優(yōu)化步驟

這篇文章提供了可以采取的切實可行的步驟來識別和修復機器學習模型的訓練、泛化和優(yōu)化問題。

2020-05-04 12:08:00

2347

機器學習該怎么學習

網(wǎng)上關于機器學習的文章，視頻不計其數(shù)，本來寫這么一篇東西，我自己也覺得有點多余，但是我還真沒找到一個能幫助像我這樣零基礎的人，快速接觸和上手機器學習的文章。這篇文章不能讓你深入學習和掌握機器學習

2020-05-12 08:54:38

811

機器學習的范圍和算法

什么是機器學習？機器學習是英文名稱MachineLearning（簡稱ML）的直譯。機器學習涉及概率論、統(tǒng)計學、逼近論、凸分析、算法復雜度理論等多門學科。

2020-11-12 10:19:12

1203

淺析嵌入式Linux學習的八大步驟

嵌入式Linux要學哪些？一些人總在尋思，怕走了彎路，又怕學的東西離企業(yè)需求遠。那么今天就請華清遠見高級講師曹大神告訴你，從這8點淺析嵌入式要學習的內(nèi)容。下面是他本人親筆。

2021-01-01 09:19:00

833

機器學習進行靜態(tài)分析的步驟

機器學習和人工智能這兩種技術在許多領域廣泛應用，尤其是在營銷分析和網(wǎng)絡安全方面，它們在這些領域的成功應用促使有些人試圖將它們用于所有方面。這其中包括使用機器學習系統(tǒng)創(chuàng)建用于定位安全漏洞的靜態(tài)代碼分析器。

2020-12-28 16:08:12

1699

ST MEMS傳感器內(nèi)嵌機器學習核心的優(yōu)勢

???????一旦您熟悉了開發(fā)步驟并掌握了機器學習項目中的要點，就能夠開發(fā)有價值的機器學習應用。此外，意法半導體提供解決方案，以促進邊緣機器學習得到廣泛應用并發(fā)揮全部潛力。本文描述了機器學習項目

2021-09-03 14:55:43

1563

淺析機器學習必學10大算法及8種降維技術

機器學習是一門多領域交叉學科，涉及概率論、統(tǒng)計學、逼近論、凸分析、算法復雜度理論等多門學科。專門研究計算機怎樣模擬或?qū)崿F(xiàn)人類的學習行為，以獲取新的知識或技能，重新組織已有的知識結構使之不斷改善自身

2022-01-30 17:14:00

956

機器學習是什么，機器學習的定義

機器學習是一門能夠讓編程計算機從數(shù)據(jù)中學習的計算機科學（和藝術）。

2022-02-03 09:18:00

7634

機器學習算法學習之特征工程1

特征工程是機器學習過程中的關鍵步驟，涉及將原始數(shù)據(jù)轉換為機器學習算法可以有效使用的格式。在本篇博客文章中，我們介紹了各種特征工程技術，包括特征選擇和提取、編碼分類變量、縮放和歸一化、創(chuàng)建新特征、處理不平衡數(shù)據(jù)、處理偏斜和峰度、處理稀有類別、處理時間序列數(shù)據(jù)、特征轉換和文本預處理。

2023-04-19 11:38:43

519

機器學習算法學習之特征工程2

2023-04-19 11:38:47

560

機器學習算法學習之特征工程3

2023-04-19 11:38:51

703

機器學習步驟詳解，一文了解全過程

機器學習是指在沒有明確指令的情況下能夠學習和加以改進的系統(tǒng)。這些系統(tǒng)從數(shù)據(jù)中學習，用于執(zhí)行特定的任務或功能。在某些情況下，學習，或者更具體地說，訓練，是在受監(jiān)督的方式下進行，當輸出不正確時對模型加以

2023-05-16 09:55:36

3603

機器學習筆記之優(yōu)化-拉格朗日乘子法和對偶分解

優(yōu)化是機器學習中的關鍵步驟。在這個機器學習系列中，我們將簡要介紹優(yōu)化問題，然后探討兩種特定的優(yōu)化方法，即拉格朗日乘子和對偶分解。這兩種方法在機器學習、強化學習和圖模型中非常流行。

2023-05-30 16:47:17

1339

機器學習和深度學習的區(qū)別

機器學習和深度學習的區(qū)別隨著人工智能技術的不斷發(fā)展，機器學習和深度學習已經(jīng)成為大家熟知的兩個術語。雖然它們都屬于人工智能技術的研究領域，但它們之間有很大的差異。本文將詳細介紹機器學習和深度學習

2023-08-17 16:11:40

2734

機器學習算法匯總機器學習算法分類機器學習算法模型

是解決具體問題的一系列步驟，機器學習的算法被設計用于從大量的數(shù)據(jù)中自動學習并不斷改進自身的性能。本文將為大家介紹機器學習算法匯總和分類，以及常用的機器學習算法模型。機器學習算法匯總機器學習算法的類型繁多，主

2023-08-17 16:11:48

632

機器學習算法總結機器學習算法是什么機器學習算法優(yōu)缺點

機器學習算法總結機器學習算法是什么?機器學習算法優(yōu)缺點? 機器學習算法總結機器學習算法是一種能夠從數(shù)據(jù)中自動學習的算法。它能夠從訓練數(shù)據(jù)中學習特征，進而對未知數(shù)據(jù)進行分類、回歸、聚類等任務。通過

2023-08-17 16:11:50

939

機器學習算法入門機器學習算法介紹機器學習算法對比

機器學習算法入門機器學習算法介紹機器學習算法對比機器學習算法入門、介紹和對比隨著機器學習的普及，越來越多的人想要了解和學習機器學習算法。在這篇文章中，我們將會簡單介紹機器學習算法的基本概念

2023-08-17 16:27:15

569

機器學習是什么意思？機器學習屬于什么分支？機器學習有什么用處？

機器學習是什么意思？機器學習屬于什么分支？機器學習是什么有什么用處？機器學習是指讓計算機通過經(jīng)驗來不斷優(yōu)化和改進自身的算法和模型的過程。因此，機器學習可以被理解為是一種從數(shù)據(jù)中自動獲取規(guī)律和知識

2023-08-17 16:30:04

1148

機器學習theta是什么？機器學習tpe是什么？

機器學習theta是什么？機器學習tpe是什么？機器學習是近年來蓬勃發(fā)展的一個領域，其相關技術和理論受到了廣泛的關注和應用。在機器學習中，theta和tpe是兩個非常重要的概念。首先，我們來了

2023-08-17 16:30:08

1023

機器學習有哪些算法？機器學習分類算法有哪些？機器學習預判有哪些算法？

機器學習有哪些算法？機器學習分類算法有哪些？機器學習預判有哪些算法？機器學習是一種人工智能技術，通過對數(shù)據(jù)的分析和學習，為計算機提供智能決策。機器學習算法是實現(xiàn)機器學習的基礎。常見的機器學習算法

2023-08-17 16:30:11

1245

機器學習發(fā)展歷程

機器學習發(fā)展歷程：機器學習發(fā)展現(xiàn)狀、機器學習發(fā)展前景和機器學習發(fā)展歷史隨著科技的快速發(fā)展，全球各個行業(yè)都在加速數(shù)字化轉型，從而加速了人工智能和機器學習的發(fā)展。機器學習已經(jīng)成為許多公司和組織實現(xiàn)商業(yè)

2023-08-17 16:30:15

1038

已全部加載完成

搜索歷史

淺析機器學習的基本步驟

評論